본문 바로가기

LLM

(7)

OpenAI, GPT-5.4-사이버 공개 / 미소스 대응 / 신청 기반 배포 확대 GPT-5.4, 고성능 AI 경쟁 속 ‘제한적 공개 + 단계적 확산 전략 공개 방식 (핵심 포인트)GPT-5.4 일부 기능/모델 제한적 공개 (사이버/부분 공개 형태) (위키백과)고성능 모델일수록 일반 사용자 공개 제한 추세 (KMJ)신청·API 기반 접근 통제형 배포 구조안전성·보안 리스크 고려한 점진적 확산 전략경쟁 배경 (미소스 대응)Anthropic의 Claude Mythos 등장 → GPT 경쟁 압박 (KMJ)Mythos, GPT-5.4 대비 벤치마크 우위 주장 사례 존재 (KMJ)AI 경쟁: GPT vs Mythos vs Gemini 3강 구도 형성 (BirdSpring)GPT-5.4 핵심 성능인간 전문가 능력 일부 영역 초월 (데스크톱 작업) (BirdSpring)컨텍스트 100만 토큰급 초..

구글, 젬마4(Gemma 4) 공개 젬마4는 “작고 배포 쉬운 오픈 모델” 전략을 한 단계 더 밀어붙인 구글의 개발자용 AI 카드이며, 특히 Apache 2.0 라이선스 전환 가능성/적용이 업계에서 가장 크게 주목받고 있습니다. (Venturebeat) 젬마4 공개의 의미 3가지구글이 Gemini는 폐쇄형 프런티어 모델, Gemma는 오픈/경량 배포 모델이라는 투트랙 전략을 더 분명히 했습니다. (Google DeepMind)이번 공개는 단순 모델 하나보다 “Gemmaverse(젬마 생태계)” 확대 관점이 큽니다. 즉, 본체 모델 외에도 번역·함수호출·의료·안전 등 특화형 파생 모델이 이미 붙는 구조입니다. (Google DeepMind)로컬/온프레미스/사내망 배포 수요가 커진 상황에서, “작지만 충분히 강한 모델” 수요를 겨냥한 전략적 ..

KT, ‘믿:음 K 2.0’ 모델 신뢰성 인증 획득 KT가 자체 개발한 초거대 언어모델(LLM)인 ‘믿:음 K 2.0 Base’가 한국정보통신기술협회(TTA)로부터 인공지능 신뢰성 인증 2.0(CAT 2.0)을 국내 최초로 획득했다. (미래를 보는 창 - 전자신문)인공지능 신뢰성 인증은 과학기술정보통신부와 TTA가 운영하는 민간 자율 인증 제도로, 인증 기준은 국제 표준(ISO/IEC 23894, AI 위험관리 프레임워크 등)을 기반으로 고도화된 CAT 2.0 체계다. (뉴시스)기존 문서, 절차 중심 평가를 넘어 운영 환경 기능과 성능을 포함해 검증한다. (미래를 보는 창 - 전자신문) ‘믿:음 K 2.0 Base’ 모델 특징구조 : 약 11.5B(115억) 파라미터 규모의 오픈소스 언어모델. (뉴시스)기능 : 텍스트 분류, 질의응답, 요약, 생성, 변환..

Gemini 3 Pro: 69%, GPT-5: 62%, 사실성(팩추얼리티) 평가 결과.... 구글이 개발한 FACTS Benchmark Suite에서 AI 챗봇들의 사실성(정확성) 점수를 측정했다. (머니컨트롤)Gemini 3 Pro가 약 69%로 가장 높은 점수를 기록했다. (머니컨트롤) “69점(%)”의 의미모델이 답변을 사실에 맞게 제공했는가?를 종합 점수로 환산한 것으로, 최상위 모델조차 10번 중 3번가량은 사실 오류(또는 불완전한 근거)를 낼 수 있다는 문제의식을 드러냅니다. (Business Insider)ZDNet Korea 보도 기준 상위권 예시는 다음과 같이 소개됩니다:Gemini 3 Pro: 69%Gemini 2.5 Pro: 62%, GPT-5: 62%Grok 4: 54%, GPT o3: 52%, Claude 4.5 Opus: 51%, GPT-4.1: 51% 지디넷 코리아벤..

AI가 잘 이해·표현하는 언어는? 지표별 측정 방법번역·표현력(표현 정확도) 지표 : WMT 2024 일반 번역 과제(인간/자동 평가, LLM 포함) 결과. Claude 3.5 Sonnet, Unbabel-Tower70B 등이 여러 언어쌍에서 상위권을 차지했고, 언어쌍별 격차가 큽니다. (www2.statmt.org)언어 범위·저자원 영향 : Meta NLLB/FLORES-200(+ FLORES+), 200개 이상 언어 방향에서 번역 품질을 인류/자동으로 측정, 저자원 언어 난이도 확인., 2024 Nature 논문 및 WMT 확장판 자료 포함. (Nature)범용 이해·추론(비번역) 지표 : Google XTREME(40개 언어, XNLI/UDPOS/MLQA 등 복수 과제)와 후속 연구들. 고자원→중자원→저자원으로 갈수록 성능 하락 경..

“문장 하나 추가하면 LLM 창의력 2배 늘어”...AI 다양성 향상법 등장 “문장 하나 추가하면 LLM 창의력 2배 늘어”...AI 다양성 향상법 등장 “문장 하나 추가하면 LLM 창의력 2배 늘어”...AI 다양성 향상법 등장 - AI타임스생성 인공지능(AI)이 내놓는 답변이 비슷하거나 반복되는 '모드 붕괴(mode collapse)' 문제를 해결하기 위한 새로운 접근법이 등장했다. AI에 다양한www.aitimes.com

인공지능의 새 불평등... 누가 ‘생성형 AI 시대’의 주인공이 되었는가 https://www.dginclusion.com/news/articleView.html?idxno=1151 인공지능의 새 불평등... 누가 ‘생성형 AI 시대’의 주인공이 되었는가 - 디지털포용뉴스◇ 기술의 빛, 그러나 그늘은 깊어지고 있다2022년 ChatGPT의 등장 이후 전 세계는 인공지능의 이름으로 다시 한 번 혁명의 소용돌이 속에 들어섰다. 텍스트www.dginclusion.com

이전 1 다음

티스토리툴바