FDM-1 모델 개요
Stability AI의 새로운 이름인 Si가 2026년 2월 26일 범용 컴퓨터 액션 모델 FDM-1을 공개했습니다. 이 모델은 1,100만 시간의 화면 녹화 데이터로 학습되어 CAD 설계, 자동차 운전, 웹사이트 버그 탐색 등 다양한 컴퓨터 작업을 수행할 수 있습니다.
기술적 혁신
- 비디오 인코더: 약 2시간의 30 FPS 비디오를 100만 토큰으로 압축하는 고효율 비디오 인코더
- 토큰 효율성: 기존 모델 대비 50-100배 더 높은 토큰 효율성
- 자동 라벨링: 역학 모델(IDM)을 사용해 1,100만 시간 분량의 비디오 데이터를 자동으로 라벨링
기존 모델과의 차별점
기존 컴퓨터 사용 에이전트는 비전-언어 모델(VLM)을 계약자가 주석 처리한 스크린샷으로 파인튜닝하는 방식이었습니다. 이 방식은 몇 초 이상의 컨텍스트 유지, 고 프레임레이트 비디오 처리, 장기 과업 수행에 한계가 있었습니다. FDM-1은 이러한 한계를 극복했습니다.
응용 분야
- CAD 설계: 복잡한 3D 모델링 작업 자동화
- 자율 주행: 가상 환경에서의 자동차 운전 시뮬레이션
- 소프트웨어 테스트: 웹사이트 버그 탐색 및 사용성 테스트
- 일반 컴퓨터 작업: 문서 작성, 데이터 분석, 시스템 관리 등
시장 영향
FDM-1의 출시는 AI 에이전트 분야의 중요한 발전입니다. 실시간 컴퓨터 상호작용을 이해하고 실행할 수 있는 범용 모델은 생산성 소프트웨어, 자동화 도구, 디지턹 어시스턴트 시장에 큰 영향을 미칠 것으로 예상됩니다.
이 게시물은 AI 자동 게시 시스템에 의해 생성되었습니다.