Trang chủ Tin tức DeepSeek AI Phát triển: Một huyền thoại trị giá 1,6 tỷ đô la được tiết lộ

DeepSeek AI Phát triển: Một huyền thoại trị giá 1,6 tỷ đô la được tiết lộ

May 16,2025 Tác giả: Sadie

Chatbot mới từ Deepseek đã tạo ra một tác động đáng kể trong thị trường AI, tự giới thiệu với tuyên bố hấp dẫn:

Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên.

Mô hình AI này không chỉ trở thành đối thủ cạnh tranh đáng gờm mà còn đóng góp cho một trong những khoản giảm giá cổ phiếu lớn nhất của Nvidia. Cách tiếp cận sáng tạo của Deepseek để phát triển AI tạo nên sự khác biệt, sử dụng các công nghệ tiên tiến như:

Dự đoán đa điểm (MTP) : Phương pháp này cho phép mô hình dự đoán nhiều từ cùng một lúc bằng cách phân tích các phần câu khác nhau, tăng cường cả độ chính xác và hiệu quả.

Hỗn hợp các chuyên gia (MOE) : Sử dụng 256 mạng thần kinh, với tám mạng được kích hoạt cho mỗi nhiệm vụ xử lý mã thông báo, kiến ​​trúc này tăng tốc độ đào tạo AI và tăng hiệu suất.

Sự chú ý tiềm ẩn đa đầu (MLA) : Bằng cách tập trung vào các phần quan trọng nhất của câu và trích xuất các chi tiết chính nhiều lần, MLA làm giảm cơ hội bỏ lỡ thông tin quan trọng, cho phép AI nắm bắt các sắc thái quan trọng.

DeepSeek Test Hình ảnh: Ensigame.com

Deepseek, một công ty khởi nghiệp nổi tiếng của Trung Quốc, tuyên bố đã phát triển một mô hình AI cạnh tranh với chi phí tối thiểu, nói rằng họ chỉ chi 6 triệu đô la cho việc đào tạo DeepSeek V3 chỉ bằng cách sử dụng 2048 bộ xử lý đồ họa. Tuy nhiên, các nhà phân tích từ Semianalysis đã tiết lộ rằng Deepseek vận hành một cơ sở hạ tầng tính toán rộng lớn, sử dụng khoảng 50.000 GPU phễu NVIDIA, bao gồm 10.000 đơn vị H800, 10.000 H100 và GPU H20 bổ sung. Các tài nguyên này được trải rộng trên nhiều trung tâm dữ liệu và được sử dụng để đào tạo, nghiên cứu và mô hình tài chính AI.

Tổng số tiền đầu tư của công ty vào các máy chủ là khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la. Deepseek là một công ty con của Quỹ phòng hộ Trung Quốc, người ta đã thành lập nó như một bộ phận tập trung AI riêng vào năm 2023. Không giống như hầu hết các công ty khởi nghiệp dựa vào điện toán đám mây, Deepseek sở hữu các trung tâm dữ liệu của mình, cho phép kiểm soát hoàn toàn tối ưu hóa mô hình AI và thực hiện đổi mới nhanh hơn. Công ty vẫn tự tài trợ, tăng cường tính linh hoạt và tốc độ ra quyết định.

Deepseek v3 Hình ảnh: Ensigame.com

Deepseek cũng thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học hàng đầu Trung Quốc. Mặc dù vậy, yêu cầu đào tạo Deepseek V3 chỉ với 6 triệu đô la có vẻ không thực tế, vì con số này chỉ chiếm mức sử dụng GPU trong quá trình đào tạo trước và loại trừ nghiên cứu, tinh chỉnh mô hình, xử lý dữ liệu và chi phí cơ sở hạ tầng.

Kể từ khi bắt đầu, Deepseek đã đầu tư hơn 500 triệu đô la vào sự phát triển của AI. Cấu trúc nhỏ gọn của nó cho phép thực hiện tích cực và hiệu quả các đổi mới AI, không giống như các công ty lớn hơn, quan liêu hơn.

Deepseek Hình ảnh: Ensigame.com

Ví dụ của Deepseek cho thấy một công ty AI độc lập, được tài trợ tốt có thể cạnh tranh với các nhà lãnh đạo trong ngành. Tuy nhiên, các chuyên gia lưu ý rằng thành công của công ty là do các khoản đầu tư đáng kể, đột phá kỹ thuật và một nhóm mạnh mẽ, thay vì "ngân sách cách mạng" để phát triển mô hình AI.

Deepseek Hình ảnh: Ensigame.com

Mặc dù vậy, chi phí của Deepseek vẫn thấp hơn so với các đối thủ cạnh tranh. Chẳng hạn, trong khi Deepseek đã chi 5 triệu đô la cho R1, chi phí đào tạo cho TATGPT4O là 100 triệu đô la. Tuy nhiên, nó vẫn rẻ hơn so với các đối thủ cạnh tranh.

Bài viết mới nhất

16

2025-05

Máy tính bảng hàng đầu để phát trực tuyến, chơi game, làm việc vào năm 2023

https://img.hroop.com/uploads/98/6812f20654369.webp

Chọn máy tính bảng hoàn hảo có thể là một nhiệm vụ khó khăn, đặc biệt là với vô số tùy chọn có sẵn. Phạm vi iPad của Apple cung cấp tất cả mọi thứ, từ các mô hình thân thiện với ngân sách đến các cường quốc cao cấp, mỗi loại có các màn hình và bộ xử lý khác nhau. Ví dụ, sự khác biệt giữa võng mạc lỏng di

Tác giả: SadieĐọc:0

16

2025-05

Repop Chainaw Repop của Lollipop đạt cột mốc bán hàng lớn

https://img.hroop.com/uploads/66/173654307567818b630dbc0.jpg

Kể từ khi ra mắt vào cuối năm ngoái, Lollipop Chainsaw Repop đã tạo nên làn sóng trong cộng đồng chơi game, gần đây đã vượt qua một cột mốc bán hàng đáng kể hơn 200.000 chiếc được bán. Bản remaster của trò chơi hành động cổ điển này đã khiến người hâm mộ mong muốn quay trở lại thế giới độc đáo của nó, mặc dù có một số ban đầu

Tác giả: SadieĐọc:0

16

2025-05

Anh hùng Fire Badge Darks Kỷ niệm 8 năm với giấy triệu tập miễn phí, nâng cấp QOL

https://img.hroop.com/uploads/76/173925362467aae778ed4f5.jpg

Nintendo tiếp tục giữ cho người hâm mộ trung thành của mình tham gia với nhượng quyền thương mại hàng đầu của mình, và Fire Badge Heroes là một minh chứng cho sự cống hiến này. Bây giờ kỷ niệm năm thứ 8 của nó, một cột mốc đáng chú ý trong thế giới chơi game di động, nơi đóng cửa bất ngờ là phổ biến

Tác giả: SadieĐọc:0

16

2025-05

Lego Mario Kart mới ra mắt ngày 15 tháng 5

https://img.hroop.com/uploads/16/682639f5b17cf.webp

Những người đam mê Lego, đánh dấu lịch của bạn! Mặc dù Lego thường tung ra các bộ mới vào đầu tiên mỗi tháng, một số bộ không thể chờ đợi và ra mắt bất cứ khi nào họ cảm thấy thích nó. Vào ngày 15 tháng 5, Lego đang đối xử với người hâm mộ với một loạt các bản phát hành mới thú vị, với bộ Mario Kart nổi bật dẫn đầu Char

Tác giả: SadieĐọc:0