Doanh số bán card năm 2024 của Nvidia tới 1/4 là tới các cty datacenter offshore cho TQ tại Singapore
😃))))
Nên bảo Trung Quốc không có card xịn để train AI là câu chuyện gimmick marketing của mấy anh China kể để nghe nó kiểu Vượt-Nghèo-Học-Giỏi thôi trong khi mấy anh TQ có thiếu quái gì tiền, nghèo thì phải nói VN mới là nghèo kìa
😃))))
Làm AI có 2 giai đoạn, giai đoạn Training và giai đoạn Inference (chạy model), thực tế về mặt khoa học và kỹ thuật thì giai đoạn Training hoàn toàn có thể sử dụng GPUs on Cloud tức là xài remote bất cứ đâu trên thế giới được, thuê tầm vài trăm ngàn con xài trong vài tháng để train rồi ngưng, chi phí trả 1 cục, không vấn đề, do mạng mẽo không cần phải mạnh phải liên tục.
Nhưng giai đoạn Inference tức là chạy model và cung cấp dịch vụ AI cho mọi người chat public thì mệt mỏi hơn, số card không thể dự đoán trước mà users tăng bao nhiêu thì số card thuê phải tăng bấy nhiêu, mạng mẽo phải liên tục, phải nhanh, chứ chậm vài giây users chửi liền. Do đó phần tốn tiền kinh khủng là phần Inference chứ không phải phần Training, chi phí Training nó có thể dự đoán trước. Nên việc thuê GPUs tại các cloud offshore là rất khó khăn trong việc planning chi phí cũng như resources. Đông Users cái là biết nhau ngay, một trong số lí do DeepSeek phải Open Source là bởi cty mẹ High-Flyer không nhiều tiền như Microsoft và OpenAI để cung cấp free mãi con AI này đâu. Vì chi phí thuê GPUs cho Inference quá cao nếu trong tình trạng bị cấm vận như TQ nên mới có cái deal anh Jasen Huang sếp Nvidia qua Việt Nam lập Trung Tâm Dữ Liệu AI và Trung tâm Nghiên Cứu AI đó
😃))))) do mạng VN và Trung Quốc khác éo gì mạng Local đâu, mạng VN qua quốc tế thì ngon nhất ĐNÁ luôn, và ship card từ Đài Loan qua VN thì thôi rồi nó gần
😃)))) Này nói thêm vì nó liên quan với vụ DeepSeek ra mắt thực ra có lợi cho VN hơn
😃))))
Nói tiếp, mình cũng từng chia sẻ là việc Mỹ cấm vận GPU hiệu suất cao đối với TQ đã khiến TQ đi một con đường nguy hiểm hơn mà Mỹ không kiểm soát được, đó là tận dụng phong trào AI nguồn mở mà Meta của Mắc dẫn đầu để phát triển các mô hình AI Nguồn Mở Quy Mô Nhỏ (Small Language Model) được chuyên biệt hoá chức năng, và sử dụng được trên các thiết bị AI ở Local như dùng card GPU gaming RTX là đủ chạy hoặc chạy được trên mấy con Raspberry Pi hoặc chạy được trên điện thoại có chip NPU (Neural Processing Unit - chip chạy AI yếu hơn GPU nhưng vẫn chạy ổn). Sếp của Trung tâm AI Facebook (FAIR) giáo sư Yann LeCun có post cái tút confirm về ý này khi DeepSeek bùng nổ, DeepSeek sử dụng mô hình nguồn mở LLaMA của Meta cho việc huấn luyện AI DeepSeek.
Người Trung Quốc từ lúc mở cửa năm 1978 đến nay, luôn tập trung vào việc “làm sao để sản xuất lớn nhanh nhất nhiều nhất”, trái ngược với người Mỹ, là làm sao để pump market cap lên maximum có thể tức là khai mở thị trường lên đến cực hạn. Đây chính là điểm khiến Mỹ phải thương chiến với TQ, nghĩ coi mình thì lo mở rộng thị trường, nhưng thằng lòi bên kia đại dương chỉ chăm chăm lo ăn sao cho lớn vô miếng bánh mà mình mất công mở
😃)))) cáu vl
😃)))
Nên anh Trump mới cấm vận TQ, rồi cấm vận chip đối với TQ, mục tiêu là để ép và ngăn TQ cắn vô thị trường mà mấy anh Mỹ tốn công mở mà chưa kịp ăn. Âu là do bản chất cách làm ăn mấy trăm năm nay của 2 đế quốc thôi.
DeepSeek thể hiện rõ lối làm ăn theo hướng tập trung tối ưu đó của TQ ngay từ cách thức tổ chức công ty, team DeepSeek có dưới 200 người, nghề chính lại còn không phải là làm AI, mà là cty con của Cty quản lý quỹ đầu tư kỹ thuật (Quant Fund) High-Flyer, đám làm AI này dùng đám card thừa khi cty mẹ xài chạy mấy model financial xong thì xài, đặc biệt là team này ếu có ông PhD nào nữa, nhân sự cốt cán của team toàn là cử nhân thôi, lại còn đến từ các trường đại học chả phải top đầu như Thanh Hoa hay Bắc Đại nữa
😃)) Nên sản phẩm DeepSeek AI của họ dĩ nhiên là hướng tới tối ưu ngay từ đầu, chi phí sao cho rẻ nhất, bán được đại trà nhất, cắn vô to nhất miếng bánh AI mà người Mỹ đã pump lên 800% chỉ trong 2 năm.
Tóm lại nói dông dài về mặt kinh tế, tài chính và địa chính trị, để nói rõ tổng quan rằng người Mỹ đã ép người Trung Quốc tới điểm “cùng tất biến” 🙂 nên DeepSeek là kết quả nhãn tiền của chính sách o ép từ Mỹ thôi 🙂
Dù mình làm cho cty AI Mỹ nhưng mình cũng ếu ưa cái chính sách cấm vận chip này của Mỹ 🙂 mỗi lần train model AI phải connect qua GPUs farm của cty bên Mỹ khổ bỏ mie 🙁
Rồi giờ tới phần phân tích khoa học về các đột phá của DeepSeek AI
😃)))) bài dài quá rồi, lại phải cắt ra thành 1 bài khác
😃)))))
Các bạn nhớ like và share (nhớ share) post này để cứu reach dùm mình 🙁 dạo này Meta AI nó bóp reach mình quá rồi
😔((((((
Link bài gốc:
https://www.facebook.com/share/p/1AD6gaJ3tk/