Hugging Face Storage Buckets 출시: 학습 체크포인트 저장 경쟁이 왜 다시 중요해졌나

Hugging Face가 버전 관리 저장소와 분리된 가변 객체 저장소 Storage Buckets를 공개했습니다. 체크포인트·데이터 샤드·로그를 더 빠르게 옮기고 중복 저장 비용을 줄이려는 흐름이 본격화되며, 머신러닝 인프라 경쟁의 무게중심이 다시 저장 계층으로 이동하고 있음을 보여줍니다.

Google AMIE 의료 AI 임상 연구 공개: 외래 진료 워크플로를 바꿀 수 있는 이유

Google이 Beth Israel Deaconess Medical Center와 진행한 실제 외래 진료 기반 연구에서 대화형 의료 AI AMIE의 안전성·진단 보조 가능성을 공개했습니다. 의료 AI 경쟁이 데모 단계에서 실제 임상 워크플로 검증 단계로 이동하고 있음을 보여주는 신호입니다.

Real5-OmniDocBench 공개: 문서 인식 모델의 현실 격차를 정량화한 첫 전면 물리 벤치마크

Real5 OmniDocBench 관련 이미지

Real5-OmniDocBench는 1,355개 문서를 실제 촬영·왜곡·조명 변화 환경에서 재구성해 VLM 문서 파싱 성능 저하 원인을 요인별로 분해한 연구입니다. 디지털 벤치마크 고득점이 곧 현장 성능을 보장하지 않는다는 점을 수치 기반으로 확인했습니다.

GLM-5 공개: 744B 아키텍처와 비동기 강화학습으로 오픈 웨이트 에이전트 코딩 성능 상향

Zhipu AI와 칭화대가 공개한 GLM-5는 744B 파라미터 구조와 비동기 강화학습 인프라를 결합해 장기 코딩 과제 성능을 끌어올렸습니다. 논문은 SWE-bench 계열과 Vending-Bench 2 등 다수 벤치마크에서 이전 세대 대비 개선을 제시하며, 코드와 모델을 함께 공개했습니다.

생성형 AI, 의료 데이터 분석 속도 대폭 단축: Cell Reports Medicine 검증이 던진 실전 신호

UCSF·웨인주립대 연구진이 생성형 AI로 대규모 임신·마이크로바이옴 데이터를 분석해, 기존 인간 중심 팀 대비 연구 파이프라인 시간을 크게 줄일 수 있음을 보여줬습니다. 다만 성능 편차와 인간 검증 필요성도 함께 확인됐습니다.