카카오, 새 LLM ‘허니비’ 공개…사진설명도 ‘척척’
AI가 강아지·고양이 사진 인식해 상황 설명
카카오 “MLLM 발전 위해 소스코드 공개”
“상호작용 통해 교육·학습 보조 도구로 사용”

[앵커]
카카오가 멀티모달 언어모델(MLLM)인 ‘허니비’를 처음 공개했습니다. 인공지능(AI)이 동물들 사진을 인식해 상황을 설명해주고, 대화를 나누는 설정까지 만들어 보여주는데요. 기존 텍스트로만 입·출력하는 거대언어모델(LLM)이 진화하고 있습니다. 윤혜림 기잡니다.
[기자]
강아지와 고양이가 함께 있는 사진을 입력합니다.
사용자가 ‘두 동물의 대화를 써달라’고 명령하자 인공지능(AI)이 상황 설명과 함께 고양이와 강아지 간 가상의 대화를 만들어줍니다.
새가 부리로 램프를 물고 있는 사진을 입력하고, ‘광고 작성을 도와달라’고 입력하자‘새 모양의 테이블 램프를 소개’하는 내용의 광고 문구를 만들어줍니다.
카카오브레인이 멀티모달 언어모델 오픈소스 ‘허니비’를 깃허브에 처음 공개했습니다.
깃허브(github)는 프로그래밍 작업을 1인이나 팀 단위로 작업할 수 있게 해주는 웹 기반 툴을 말합니다.
허니비는 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있습니다. 기존 거대언어모델(LLM)이 텍스트로만 입·출력했는데, 허니비는 이미지 입력이 가능할 정도로 진화한 겁니다.
현재 MLLM에 대한 연구는 공개된 모델의 수가 적고, 학습 방법 역시 자세히 공개되지 않아 개발이 어려운 상황.
카카오브레인은 MLLM 발전을 위해 이 소스코드를 공개했습니다.
[싱크] 노병석 / 카카오브레인 Multimodal Understanding 연구팀장
“허니비 모델의 추론을 가능하게 하는 코드를 깃허브에 공개하였으며, 허니비를 활용한 각종 연구와 서비스 확장을 고려 중입니다. 카카오브레인은 더욱 발전된 AI 모델 확보를 위해 끊임없이 연구 및 개발을 진행할 예정입니다.”
카카오브레인은 허니비가 사용자와 상호작용이 가능한 만큼 향후 효과적인 교육과 학습 보조 도구로 사용될 것으로 전망하고 있습니다.서울경제TV 윤혜림입니다. /grace_rim@sedaily.com
[영상취재 허재호 / 영상편집 김가람]
[ⓒ 서울경제TV(www.sentv.co.kr), 무단 전재 및 재배포 금지]
관련뉴스
- 이창용 "美中 관세협상 안되면 90일 유예 연장돼도 경제비용 커"
- 한국마사회, 승용마 번식 지원 사업…80두 규모 무상 지원
- 김해공항~중앙아시아 하늘길 열린다…부산~타슈켄트 6월 취항
- 美 SEC 신임 위원장 "가상화폐 규제 불확실성으로 혁신 제한"
- “에어컨 대신 맵탱”…삼양식품, WWF 업무협약 체결
- 신세계면세점, ‘트렌드웨이브 2025’ 파트너사…"쇼핑 혜택 제공"
- 美 캘리포니아주, 자율주행 트럭 시험운행 허용 추진
- 영풍 석포제련소 인근, 비소 등 환경오염 '심각'
- 주유소 기름값 11주 연속 내려…“다음 주도 하락세 지속”
- “최장 6일”…여행·면세업계, 5월 황금연휴 특수 노린다
주요뉴스
오늘의 날씨
마포구 상암동℃
강수확률 %
기획/취재
주간 TOP뉴스
- 1이변 없었던 민주당 호남경선...'어대명' 한 발 다가서
- 2더불어민주당 호남권 경선...이재명 88.69% 압승
- 3“도자기의 색, 이천의 빛” 이천도자기축제 개막
- 4모두를 위한 무장애 관광
- 530일 팡파르…'소리'로 세계를 열다
- 6이창용 "美中 관세협상 안되면 90일 유예 연장돼도 경제비용 커"
- 7대한노인회 남원시지회, 제28회 지회장기 노인게이트볼 대회 성료
- 8한국마사회, 승용마 번식 지원 사업…80두 규모 무상 지원
- 9김해공항~중앙아시아 하늘길 열린다…부산~타슈켄트 6월 취항
- 10"제29회 기장멸치축제 즐기러 오세요"…25~27일 대변항서 축제
댓글
(0)