본문 바로가기

NPU

(5)
학습(Training)의 시대에서 추론(Inference)의 시대로, 연산보다 데이터 공급 병목 생성형 AI가 학습(Training) 중심에서 추론(Inference) 중심으로 이동하면서, 연산보다 데이터 공급(메모리 대역폭·용량)이 병목이 되어 HBM, 서버 DRAM, NAND까지 동반 호황이 전개될 수 있다는 전망이 확산. (한국경제)국내 보도는 2026년 메모리 반도체 시장이 약 4,400억 달러 규모로 커지며, 시장 전망이 크게 상향(IB 전망 30% 상향 언급)됐다는 프레임으로 “내년 시장 두 배”를 제시. (한국경제)해석 포인트 : “두 배”는 해당 기사에서 설정한 기준(전년 대비·집계 범위)을 전제로 한 표현이며, 리서치 기관별 범주(HBM 포함/제외 등)에 따라 수치 차이가 날 수 있음. (한국경제) 왜 ‘추론 시대’가 메모리 전성기를 만들나(기술/서비스 구조)LLM 추론은 KV 캐시..
국산 NPU로 피지컬 AI를 돌린다, K-엔비디아 프로젝트 정부가 국산 AI반도체(NPU 등) 생태계를 ‘엔비디아급’으로 키우기 위해 투자, 실증, SW플랫폼, 공공수요까지 묶어 추진하는 AI반도체 도약 패키지(정책·펀드·실증 연계)를 발표했다. (서울경제)학습용 GPU 시장(엔비디아 중심)뿐 아니라, 앞으로 커질 저전력, 고효율 ‘추론’ 및 ‘피지컬 AI(로봇, 제조, 국방 등 물리세계 적용)’ 영역을 선점하겠다는 방향을 명시했다. (현대경제)즉, “GPU 대체”가 아니라 피지컬 AI/추론에 강한 국산 NPU 경쟁력 확보를 정책 전면에 둔 것으로 해석 할수있다. (다음) 정책 패키지 주요내용 A. K-NPU 프로젝트(성능·SW 풀스택·실증)SW 풀스택 기반 성능 고도화 및 한국형 CUDA(쿠다) 플랫폼 개발을 추진하는 내용이 보도됨. (서울경제)2027년까지 ..
2025 인공지능반도체 미래기술 컨퍼런스 리뷰 2025 인공지능반도체 미래기술 컨퍼런스는 국산 AI 반도체 성능평가기준 ‘K-Perf’ 공개 및 협의체 출범과 함께 R&D 성과, 산업 협력 확대 및 정부의 AI 반도체 전략을 논의하는 자리였다. (First-Class 경제신문 파이낸셜뉴스) 국산 AI 반도체 성능 기준 K-Perf 발표산업계, 정부가 공동으로 마련한 국산 신경망처리장치(NPU) 성능지표 ‘K-Perf’를 소개·공개함. (First-Class 경제신문 파이낸셜뉴스)K-Perf는 수요기업이 요구하는 다양한 서비스 환경 기준을 반영해 NPU 성능 측정 모델, 조건, 지표를 세분화한 것이 특징. (대한민국 정책브리핑)이를 통해 실제 사용 환경 중심의 성능 데이터 표준화, 공유 체계 기반 마련 기대. (First-Class 경제신문 파이낸셜뉴..
리벨리온, 국산 NPU를 기반으로 풀스택 K-AI 완성하겠다... 리벨리온은 SKT 컨소시엄과 함께 국산 NPU를 기반으로 ‘풀스택 K-AI’를 완성하겠다고 발표했다. (뉴스프라임) 풀스택 K-AI 는 반도체(NPU), 인프라, 파운데이션 모델, 서비스까지 전 층위를 국산 기술로 구현하겠다는 개념 이다. (SK텔레콤 뉴스룸)해외 GPU·클라우드 의존도를 줄이고, 한국형 AI 기술 주권(소버린 AI)을 확보하는 것이 목표라고 밝혔다. (유니콘팩토리) 리벨리온 NPU 적용 현황SKT는 리벨리온 ATOM NPU 탑재 서버를 자체 핵심 서비스에 테스트 중테스트 결과에 따라, 대규모 추론용 ‘ATOM-Max’의 상용 적용 및 NPU 서버 도입 확대 계획. (Rebellions)/ 국산 NPU의 기술, 사업적 의미 리벨리온 ATOM은 이전 벤치마크에서 일부 언어·비전 추론에서 ..
퓨리오사AI, 2026년 본격 NPU양산 시작., GPU 대체 가능성은.... 퓨리오사AI는 2세대 NPU인 레니게이드(RNGD)를 2026년 1월부터 양산한다고 공식 발표했습니다. 한국경제+2한국경제+2레니게이드는 AI 모델 “추론(Inference)” 용도에 특화된 가속기로, 글로벌 데이터센터와 클라우드 서비스 시장을 타깃으로 삼고 있습니다. 한국경제+2더벨+2가격 정책도 경쟁적입니다. 권장가격 기준으로 약 1만 달러(한화 약 1,300-1,400만 원) 수준으로 설정되어, 경쟁 제품 대비 경쟁력을 확보하려는 모습입니다. 미래를 보는 창 - 전자신문+2동아일보+2 양산 시점 : 2026년 1월부터 TSMC 5nm 공정에서 2세대 NPU ‘레니게이드(RNGD)’ 양산 시작.한국경제 타깃 시장 : GPU처럼 학습용이 아니라, 추론(Inference) 특화 칩으로 데이터센터, 엣지(..