본문으로 가기

오픈소스 SW동향

오픈소스SW 동향 상세
[해외기사] 알리바바 클라우드, 대규모 언어 모델(LLM) 오픈소스로 공개
  1. 작성일 :
  2. 2023.09.18
  3. 작성자 :
  4. 컨설팅
  5. 조회수 :
  6. 238

2023.08.08

알리바바 클라우드가 70억개 파라미터를 갖춘 대규모 언어 모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다.
'Qwen-7B'는 2조개 이상 토큰을 사전 학습했다. 중국어·영어·기타 다국어 자료, 코드, 수학 등 전문 지식도 포괄한다. 사전 학습된 'Qwen-7B' 모델은 대규모 다중작업 언어이해(MMLU) 벤치마크에서 좋은 성과를 거두었다. 주요 사전학습 오픈소스 모델 성능을 능가했다. 인문학, 사회과학, STEM(과학, 기술, 공학, 수학), 기타 분야를 포함한 총 52개 주제를 다루고 있다.


원문보기:

https://www.etnews.com/20230808000194


[원문출처]
※ 본 내용은 전자신문(www.etnews.com)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ ㈜전자신문인터넷 무단전재 및 재배포 금지
자세한 기사는 링크를 참조하시기 바라며 한국저작권위원회는 공정한 오픈소스SW 사용을 위하여 상담, 컨설팅, 라이선스 교육, 오픈소스SW 라이선스 검사서비스 등을 무료로 제공하고 있습니다.

  1. 첨부파일
이전글, 다음글
이전글 [해외기사] 이파피루스, C#·닷넷 개발자를 위한 '고스트스크립트' 라이브러리 인수
다음글 [해외기사] 오라클·수세·CIQ, 反레드햇 협회 결성

목록