Chandra OCR — Mac Studio M1 Max 64GB에서 실행하기 (CUDA vs Metal MPS 비교)

4B 파라미터 Vision-Language OCR 모델 Chandra를 Mac Studio M1 Max 64GB에서 실행하는 방법과 CUDA 환경과의 성능 비교를 정리합니다.

ilikeafrica

26 Mar 2026 — 2 min read

Chandra OCR란?

Datalab이 개발한 Chandra OCR은 이미지와 PDF를 HTML, Markdown, JSON으로 변환하는 고성능 문서 인식 모델입니다. 4B 파라미터 Vision-Language 모델(Qwen3VL 아키텍처) 기반으로, olmOCR 벤치마크에서 85.9% 성능을 달성했습니다.

주요 특징

표, 수식, 손글씨, 체크박스 등 복잡한 레이아웃 처리
90개 이상 언어 지원 (비라틴 문자 포함)
전체 페이지 단위 처리 (청크 분할 없음)
HuggingFace 로컬 추론 또는 vLLM 서버 방식 지원

CUDA vs Mac Studio M1 Max 성능 비교

환경	페이지당 처리 시간	비고
NVIDIA H100	~0.7초	서버급 GPU, 96 시퀀스 병렬
NVIDIA RTX 3060	~2~3초	일반 데스크탑 GPU
Mac Studio M1 Max (Metal MPS)	~5~10초	본 테스트 환경
CPU only (M1)	~15~25초	GPU 미사용시

CUDA 전용인 Flash Attention을 사용하면 NVIDIA GPU에서 30~50% 추가 성능 향상이 가능하지만, Mac에서는 지원되지 않습니다.

내 Mac Studio 사양

모델: Apple Mac Studio (2022)
칩: Apple M1 Max
CPU: 10코어 (8 Performance + 2 Efficiency)
GPU: 24코어 (Metal 4 지원)
통합 메모리: 64GB

메모리 여유도

항목	사용량
Chandra 4B 모델 (fp16)	~8GB
추론 중 KV 캐시 + 활성화 메모리	~4~6GB
총 예상 사용량	12~16GB
여유 메모리	48~52GB

64GB 통합 메모리 덕분에 200페이지 이상의 대용량 PDF도 메모리 부족 없이 처리 가능합니다.

Mac Studio에서 설치하기

# 1. Python 3.11 가상환경 생성
python3.11 -m venv chandra-env
source chandra-env/bin/activate

# 2. PyTorch (Metal MPS 자동 포함)
pip install torch torchvision

# 3. Chandra OCR 설치
pip install chandra-ocr[hf]

# 4. Metal GPU 가속 확인
python3 -c "import torch; print(torch.backends.mps.is_available())"
# → True 출력되면 GPU 가속 활성화

# 5. 실행
chandra input.pdf ./output --method hf

결론

Chandra OCR은 CUDA 없이 Mac Studio에서도 완전히 실행 가능합니다. M1 Max 24코어 GPU와 64GB 통합 메모리 조합은 소~중량 문서 처리에 충분히 실용적인 성능을 제공합니다. NVIDIA GPU 대비 속도는 2~5배 느리지만, 메모리 여유와 안정성 면에서는 오히려 유리합니다.

개인 문서 처리, 연구, 개발 용도라면 별도 서버 없이 Mac Studio 하나로 충분히 활용할 수 있습니다.

다이소 겨자잎,루꼴라 5일차

하루가 다르게 커가는 겨자잎과 루꼴라. 근데 어떤게 겨자잎이고 어떤게 루꼴라인지 벌써 모르겠다. 이래서 처음에 표시를 해 둔다는게 또 깜빡했다. 이젠 나도 모르겠다. 그냥 먹을때쯤 알게 됬겠지. 오전오후엔 햇살로...저녁엔 인공LED광으로.... 예전에도 이렇게 빨리 컷나 싶은데 재밌다.

ollama Cloud oss120B급 병렬 분석 효율 분석: 1개 vs 8개 워커 비교

대규모 학술 논문 아카이브 KOINEU.com의 V3 파이프라인 구축 과정에서 얻은 데이터 분석 속도 최적화 사례를 공유합니다. 25만 건의 방대한 논문을 분석하기 위해 Ollama Cloud의 oss120b 모델을 어떻게 효율적으로 활용했는지에 대한 기술 리포트입니다.. 1. 실험 개요 초거대 모델(120B)은 압도적인 분석 능력을 자랑하지만, 단일 요청 시 처리 시간이 길다는

다이소 겨자잎, 루꼴라 씨앗 발아 3일차

역시 씨앗은 한번 발아하면 참 놀랍도록 빠르다. 타임랩스를 찍어보고 싶었는데 이젠 그럴 만한 디바이스가 없다. 모조리 당근행 해버린 관계로 집에 남아있는게 별로 없다. ㅋㅋ 언제 떠날지 또 미지수인 관계로 그 날까지는 뭔가 즐길거리를 찾아야 한다. 겨자잎에 삼겹살 한번이라도 싸먹고 나가게 될까... 겨자잎 안먹어도 좋으니 언능 정리되고 배낭 싸고 싶다..

도시 농부 겨자잎, 루꼴라 키우기

오피스텔 책상 한켠에 마련해둔 겨자잎 과 루꼴라 공장.. 알리에서 구매했던 인공조명LED를 그냥 두기도 아깝고 겸사 겸사 생수통 3개에 다이소에서 천원씩에 구매한 겨자잎과 루꼴라 씨를 뿌리고 만들어봤다. 배양토에 파종한지 2일만에 싹이 돋아난다. 부랴 부랴 재활용품 모아둔곳에서 적당한 박스 하나 사서 LED 조명을 대충 붙이고, 전원은 사용하지 않고 있던 휴대용 배터리로 간편하게