본문 바로가기

NPU

(10)

AI반도체 성능 검증 표준(ML-Perf, K-Perf) - ML-Perf : 글로벌 AI 반도체 성능의 국제 표준- K-Perf : 국산 AI 반도체의 실제 산업 활용 성능을 검증하는 한국형 벤치마크 ML-PerfMLCommons에서 개발·운영하는 국제 표준 AI 성능 벤치마크AI 반도체(GPU, NPU, CPU, AI 가속기)의 성능을 객관적으로 비교하기 위해 만들어졌으며, 전 세계적으로 가장 널리 인정받는 AI 성능 평가 기준 중 하나입니다.주요특징AI 반도체의 성능을 공정하게 측정학습(Training)과 추론(Inference) 성능 평가전력 효율성 측정 가능글로벌 기업들이 참여NVIDIA AMDIntelQualcommGoogle평가 분야 예시LLM(대규모 언어모델)이미지 분류객체 탐지추천 시스템음성 인식생성형 AIK-PerfK-Perf(Korea AI..

SK텔레콤, Arm, 리벨리온 3사 협력 차세대 AI 추론 서버 개발 기존 GPU 중심 구조 → CPU+NPU 구조로 전환 시도핵심 구성 : o Arm AGI CPU + 리벨리온 NPU(리벨카드)목적 : 전력 효율 극대화, 데이터센터 운영 비용 절감, GPU 의존도 축소적용 : SKT AI 데이터센터 실증, 자체 모델 A.X K1 운영 검토 구조CPU: 시스템 제어 및 범용 처리NPU: AI 추론 연산 전담 전략 방향 : “학습(Training) → 추론(Inference)” 중심 전환 대응기대효과저전력, 고효율 AI 인프라 확보글로벌 AI 데이터센터 경쟁력 강화1) 기술 구조 (핵심 아키텍처)GPU → 범용 병렬처리 (비효율적 전력 구조)CPU + NPU → 역할 분리형 이종 컴퓨팅CPU : IO, 네트워크, 메모리 관리NPU : AI 추론 연산 최적화 결과 : 성능 유..

퓨리오사AI NPU, 삼성클라우드 통해 서비스 제공 국산 AI 반도체가 처음으로 ‘클라우드 서비스 상품’이 되는 전환점입니다. (알파경제)퓨리오사AI의 2세대 NPU RNGD(레니게이드)가 삼성SDS 클라우드 기반 서비스형 인프라(NPUaaS)로 제공될 예정입니다. (알파경제)의미는 단순 납품이 아니라, 국산 NPU가 실제 기업용 AI 클라우드 인프라로 들어간 첫 상징적 사례라는 점입니다. (알파경제)주요내용퓨리오사AI는 삼성SDS와 협력해, 자사 2세대 데이터센터용 NPU RNGD를 삼성 클라우드 인프라에서 서비스할 계획을 공개했습니다. (알파경제)보도에 따르면 삼성SDS는 2026년 7월경 국산 NPU 기반 NPUaaS를 출시할 예정입니다. (알파경제)중요점지금까지 국내 AI 반도체 스타트업들은 기술 시연·PoC(실증) 중심이 많았지만, 이번 건은 실..

엔비디아, 게이밍 GPU 전략 변화 엔비디아가 2026년 신규 게이밍 GPU(GeForce/RTX) 출시를 하지 않거나 연기하는 방안을 검토 중이다. 이는 메모리(HBM) 공급 부족이 주된 원인으로 지목된다. (글로벌경제뉴스)업계 보고에 따르면 2026년 RTX 50 시리즈의 신제품(예: RTX 5080 Super 등) 출시/양산이 우선순위에서 밀려나거나 연기되고 있다. (Tom's Hardware)메모리 반도체, 특히 HBM(고대역폭 메모리) 공급 부족이 심각해 AI 데이터센터용 GPU에 메모리가 우선 할당되는 전략이 시행되고 있다. (글로벌경제뉴스)이로 인해 엔비디아는 게이밍 GPU 부문을 당분간 후순위로 두고 AI 가속기/데이터센터 GPU에 자원 집중하는 방향으로 사업 전략을 조정하는 것으로 알려졌다. (Nate News)이는 약 3..

KAIST, 엔비디아보다 2.1배 빠른 AI 반도체 기술 개발 기술명 ‘오토GNN(AutoGNN)’ : 그래프 신경망(GNN) 추론에 특화된 AI 반도체 기술 개발. (미래를 보는 창 - 전자신문)개발 주체 : KAIST 전기및전자공학부 정명수 교수 연구팀. (미래를 보는 창 - 전자신문)주요 성능 : 엔비디아 고성능 GPU(NVIDIA RTX3090 기준) 대비 추론 속도 최대 2.1배 빠름. (지디넷코리아)전력 효율 : 동일 작업 대비 전력 소비는 크게 감소3.3배 이상 효율적이라는 평가도 있음. (지디넷코리아)핵심 해결 과제 : 전통 GPU는 그래프 데이터 전처리 연산에서 병목이 발생KAIST 기술은 이 병목 구간을 반도체 내부 구조로 최적화하여 제거함. (다음)전처리 최적화 : 추론 이전의 그래프 전처리가 전체 처리 시간의 70~90%를 차지한다는 점을 연구..

학습(Training)의 시대에서 추론(Inference)의 시대로, 연산보다 데이터 공급 병목 생성형 AI가 학습(Training) 중심에서 추론(Inference) 중심으로 이동하면서, 연산보다 데이터 공급(메모리 대역폭·용량)이 병목이 되어 HBM, 서버 DRAM, NAND까지 동반 호황이 전개될 수 있다는 전망이 확산. (한국경제)국내 보도는 2026년 메모리 반도체 시장이 약 4,400억 달러 규모로 커지며, 시장 전망이 크게 상향(IB 전망 30% 상향 언급)됐다는 프레임으로 “내년 시장 두 배”를 제시. (한국경제)해석 포인트 : “두 배”는 해당 기사에서 설정한 기준(전년 대비·집계 범위)을 전제로 한 표현이며, 리서치 기관별 범주(HBM 포함/제외 등)에 따라 수치 차이가 날 수 있음. (한국경제) 왜 ‘추론 시대’가 메모리 전성기를 만들나(기술/서비스 구조)LLM 추론은 KV 캐시..

국산 NPU로 피지컬 AI를 돌린다, K-엔비디아 프로젝트 정부가 국산 AI반도체(NPU 등) 생태계를 ‘엔비디아급’으로 키우기 위해 투자, 실증, SW플랫폼, 공공수요까지 묶어 추진하는 AI반도체 도약 패키지(정책·펀드·실증 연계)를 발표했다. (서울경제)학습용 GPU 시장(엔비디아 중심)뿐 아니라, 앞으로 커질 저전력, 고효율 ‘추론’ 및 ‘피지컬 AI(로봇, 제조, 국방 등 물리세계 적용)’ 영역을 선점하겠다는 방향을 명시했다. (현대경제)즉, “GPU 대체”가 아니라 피지컬 AI/추론에 강한 국산 NPU 경쟁력 확보를 정책 전면에 둔 것으로 해석 할수있다. (다음) 정책 패키지 주요내용 A. K-NPU 프로젝트(성능·SW 풀스택·실증)SW 풀스택 기반 성능 고도화 및 한국형 CUDA(쿠다) 플랫폼 개발을 추진하는 내용이 보도됨. (서울경제)2027년까지 ..

2025 인공지능반도체 미래기술 컨퍼런스 리뷰 2025 인공지능반도체 미래기술 컨퍼런스는 국산 AI 반도체 성능평가기준 ‘K-Perf’ 공개 및 협의체 출범과 함께 R&D 성과, 산업 협력 확대 및 정부의 AI 반도체 전략을 논의하는 자리였다. (First-Class 경제신문 파이낸셜뉴스) 국산 AI 반도체 성능 기준 K-Perf 발표산업계, 정부가 공동으로 마련한 국산 신경망처리장치(NPU) 성능지표 ‘K-Perf’를 소개·공개함. (First-Class 경제신문 파이낸셜뉴스)K-Perf는 수요기업이 요구하는 다양한 서비스 환경 기준을 반영해 NPU 성능 측정 모델, 조건, 지표를 세분화한 것이 특징. (대한민국 정책브리핑)이를 통해 실제 사용 환경 중심의 성능 데이터 표준화, 공유 체계 기반 마련 기대. (First-Class 경제신문 파이낸셜뉴..

이전 1 2 다음

티스토리툴바