세계 최고 수준 거대언어모델(LLM) 개발을 위한 충분한 학습용 데이터를 제공하겠다는 취지다. 독자 AI 모델 사업에 참여하는 기업이 AI 학습에 활용할 수 있는 유·무료 고품질 학습 데이터를 보유한 공공·민간 데이터 보유 기관 모두 참여할 수 있다.
각 기관이 보유한 데이터의 최종 활용 여부는 개발팀 선발 이후 실제 수요를 바탕으로 협약으로 확정된다. 협약은 과기정통부, 한국지능정보사회진흥원(NIA), 한국데이터산업진흥원(K-DATA)과 데이터 공급기관, 정예 개발팀 간 체결된다.
<중략>