완벽한 태블릿을 선택하는 것은 특히 수많은 옵션을 사용할 수있는 어려운 작업이 될 수 있습니다. Apple의 iPad 범위는 예산 친화적 인 모델부터 고급 발전소에 이르기까지 각각의 다양한 디스플레이와 프로세서가 특징입니다. 예를 들어, 액체 망막 di의 차이
작가: Sadie독서:0
DeepSeek의 새로운 챗봇은 AI 시장에 큰 영향을 미쳤으며 흥미로운 진술을 소개했습니다.
안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 대답을 얻을 수 있도록 만들어졌습니다.
이 AI 모델은 강력한 경쟁자가 될뿐만 아니라 Nvidia의 가장 큰 주가 하락 중 하나에 기여했습니다. AI 개발에 대한 DeepSeek의 혁신적인 접근 방식은 다음과 같은 고급 기술을 사용하여 차별화됩니다.
MTP (Multi-Token Prediction) :이 방법을 사용하면 모델이 다른 문장 부분을 분석하여 정확도와 효율성을 모두 향상시켜 여러 단어를 한 번에 예측할 수 있습니다.
전문가 혼합 (MOE) : 256 개의 신경망을 사용하여 각 토큰 처리 작업마다 8 개의 활성화 된이 아키텍처는 AI 교육 속도를 높이고 성능을 향상시킵니다.
MLA (Multi-Head Prenatent Attention) : 문장의 가장 중요한 부분에 초점을 맞추고 주요 세부 사항을 반복적으로 추출함으로써 MLA는 중요한 정보를 누락 할 가능성을 줄여 AI가 중요한 뉘앙스를 캡처 할 수 있습니다.
이미지 : ensigame.com
저명한 중국 스타트 업인 Deepseek은 최소 비용으로 경쟁력있는 AI 모델을 개발했다고 주장하면서 2048 개의 그래픽 프로세서를 사용하여 DeepSeek V3 교육에 6 백만 달러를 지출했다고 주장합니다. 그러나 Semianalysis의 분석가들은 DeepSeek이 10,000 H800 단위, 10,000 H100 및 추가 H20 GPU를 포함하여 약 50,000 NVIDIA HOPPER GPU를 사용하여 광대 한 계산 인프라를 운영하고 있음을 밝혀 냈습니다. 이러한 리소스는 여러 데이터 센터에 퍼져 있으며 AI 교육, 연구 및 재무 모델링에 사용됩니다.
회사의 서버에 대한 총 투자는 약 16 억 달러이며 운영 비용은 9 억 9,400 만 달러로 추정됩니다. DeepSeek은 중국 헤지 펀드 하이 플라이어의 자회사로 2023 년에 별도의 AI 중심 부서로 설립했습니다. 클라우드 컴퓨팅에 의존하는 대부분의 스타트 업과 달리 데이터 센터를 소유하고있어 AI 모델 최적화와 더 빠른 혁신 구현을 완전히 제어 할 수 있습니다. 회사는 자체 자금을 유지하여 유연성과 의사 결정 속도를 향상시킵니다.
이미지 : ensigame.com
Deepseek은 또한 최고의 인재를 유치하며 일부 연구자들은 주로 중국 대학에서 주로 130 만 달러 이상을 벌고 있습니다. 그럼에도 불구하고, 6 백만 달러에 대한 DeepSeek V3 교육의 주장은 비현실적 인 것처럼 보입니다.이 수치는 사전 훈련 중에 GPU 사용을 설명하고 연구, 모델 개선, 데이터 처리 및 인프라 비용을 배제하기 때문입니다.
DeepSeek은 처음부터 AI 개발에 5 억 달러 이상을 투자했습니다. 소형 구조는 더 큰 관료적 회사와 달리 AI 혁신의 적극적이고 효과적인 구현을 허용합니다.
이미지 : ensigame.com
DeepSeek의 예에 따르면 잘 자금을 지원 받고 독립적 인 AI 회사는 업계 리더와 경쟁 할 수 있습니다. 그러나 전문가들은이 회사의 성공은 AI 모델 개발을위한 "혁신적인 예산"보다는 상당한 투자, 기술 혁신 및 강력한 팀 때문이라고 지적합니다.
이미지 : ensigame.com
그럼에도 불구하고 DeepSeek의 비용은 경쟁 업체의 비용보다 저렴합니다. 예를 들어, DeepSeek은 R1에 5 백만 달러를 소비했지만 ChatGPT4O의 교육 비용은 1 억 달러였습니다. 그러나 경쟁사보다 여전히 저렴합니다.
16
2025-05
16
2025-05
16
2025-05