[ AI ][ DeepSeek AI: sự trỗi dậy của AI phương đông hay AI Trung Quốc có thực sự đe doạ phương...

#ai

Post này của bạn Nguyễn Hồng Phúc đăng trên Facebook cá nhân. Mình thấy hay nên mang về để anh em đọc.
-----------------------------------------------------------------------------------
[ AI ][ DeepSeek AI: sự trỗi dậy của AI phương đông hay AI Trung Quốc có thực sự đe doạ phương tây ? ]

Hôm nay mọi người trên thế giới bắt đầu nói về con AI mới mạnh hơn ChatGPT của OpenAI Mỹ và NÓ-MIỄN-PHÍ và đến từ … Trung Quốc tên DeepSeek. Ứng dụng iOS tên DeepSeek AI Assistant hiện đứng top 1 ứng dụng hot vượt qua ChatGPT, và đang gây ra một thứ gọi là “Thời Khắc ChatGPT” (ChatGPT Moment - kiểu quào AI vãi lúa kinh vậy) một lần nữa sau 2 năm kể từ khi ChatGPT lan khắp thế giới và đánh dấu sự khởi đầu của cuộc cách mạng AI. Cái quái gì đang xảy ra vậy ?

Là một người nghiên cứu khoa học Machine Learning nhiều năm và đang phát triển kinh doanh AI trên nhiều thị trường, mình có kinh nghiệm để giải thích một chút về những gì đang xảy ra để giáỉ đáp một chút thắc mắc trên. Bài sẽ hơi dài và có phần khoa học nếu bạn tò mò để coi lúc chờ giao thừa 😆))))
[ Phần dành cho bình dân tò mò AI: DeepSeek hơn gì ChatGPT mà nó gây quào kinh vậy ? ]
Đầu tiên, nó là … ChatGPT 😃)), ChatGPT đã trở thành danh từ chung để gọi AI dạng Chatbot suốt trong 2 năm qua 😃 nên mình dùng từ này để mô tả về con AI DeepSeek nhé, tức DeepSeek AI nó là cái App AI Chatbot mà bạn tải về smartphone của bạn và chat với AI y chang cái App ChatGPT. Tóm lại nó là một AI Chatbot dùng được ở trên điện thoại smartphone, hoặc dùng thông qua web deepseek ai, bạn chat hỏi nó, và nó trả lời

Điều đầu tiên là giống, và đây là những thứ khác…

NÓ MIỄN PHÍ NGAY TỪ ĐẦU, vâng DeepSeek cho free ngay từ đầu một con AI có chất lượng tương đương ChatGPT Plus hay Gemini Advanced 50$ 😃)))) Một chiêu quá quen thuộc của anh em Trung Hoa khi giới thiệu sản phẩm, công thức cho free - gồng lỗ để thu hút users ban đầu cho đông 😃)))) từ từ bào chúng nó (users) sau 😃))))

Nó có khả năng Tư Duy Suy Luận (Self-Reasoning) rất tốt, một trong những cấp độ thông minh của AI mà mãi tới năm vừa rồi OpenAI mới làm được và diếm như mèo giấu mứt mãi mới dám đưa ra cộng đồng sử dụng - nhưng vẫn rất giới hạn số lượt sử dụng. Mình sẽ nói về đột phá khoa học của con AI DeepSearch Reasoning 1 (R1) này ở phần khoa học phía dưới. Tóm lại là con AI này có khả năng Tư Duy Suy Luận nên nó Khôn-Vãi-Mứt, Khôn hơn cả conAI cấp độ Nghiên Cứu Sinh Tiễn Sĩ của OpenAI là O1 luôn 😃, chưa so được với con AI cấp độ tiến sĩ O3 do bọn OpenAI vẫn dấu như mèo dấu mứt nên lấy gì mà so.

Đặc biệt, nó open-source (open một phần - chỉ open cho tải Mô Hình), dĩ nhiên với người bình dân thì cái khái niệm này đếch quan trọng lắm, free là vui rồi 😃)) nhưng bình tĩnh, hãy nhớ một điểm thôi, khi một AI Open-Source (Mở Mã Nguồn) thì có nghĩa là bạn sẽ được xài free hoặc rẻ rất rẻ mãi mãi, không thằng này free thì có thằng khác tải về, cài đặt rồi dựng thành AI free cho bạn xài. Nói chung an tâm là kiểu mie gì nó cũng free hoặc rất rẻ, mãi mãi 😃)))

Vậy đó, nó hot chỉ bởi vậy thôi, đã ngon mà còn free lại còn là AI thứ đang thời thượng ai cũng cần nữa, thì nó ếu hót thì cái gì hót ???

[ Phần dành cho người muốn hiểu rõ tại sao Mỹ lo sợ trước AI DeepSeek, cơ hội cho VN từ AI DeepSeek ? ]

Douma hôm nay 1000 tỉ đô đã bay khỏi thị trường chứng khoán Mỹ do DeepSeek đạp đám cổ phiếu Big Tech xuống lỗ 😃))))))

Lí do là các nhà đầu tư đang đặt câu hỏi to bự: bọn Big Tech US năm vừa rồi đã đốt 200 tỉ đô cho hạ tầng AI (chủ yếu mua card của Nvidia) có thực sự đáng tiền hay ko ? hay bọn nó đang đốt tiền ngu ? hay bọn nó đang bùa các cổ đông ?

Thằng DeepSeek của China mới hô là tụi nó clone OpenAI chỉ với 5 triệu đô thôi kìa 1/100 so với tụi OpenAI và Microsoft đã đầu tư để train AI 🙃

Thú vị là cổ phiếu rớt đậm sâu nhất là cổ … NVIDIA (NVDA) 😃)))) lí do là thằng DeepSeek hô chỉ cần 1/100 số card để train AI mà còn là card cùi (H800) chứ không phải card xịn nhứt (H100) của NVDA nữa 😃))) thế thì tất cả các khoản đầu tư dự kiến mua 1.5 triệu con card như META của Mắc giờ phải tạm ngưng lại ngay để đánh giá xem có thể tiết kiệm không. Thế thì anh Nvidia đi bụi chứ gì 😃))))) card cùi của ảnh đang tồn ở kênh phân phối vô cùng nhiều với hàng cũ (gaming) từ thời crypto còn đầy ra kìa 😃))))
Nghe trên X đồn là Trung tâm nghiên cứu AI của Facebook (FAIR) mấy ngày vừa qua khá hỗn loạn khi ban quản trị META chửi bẹt đội kỹ sư vì DeepSeek base trên LLaMA nhưng phí train rẻ hơn. Đội kỹ sư thì đang mổ xẻ model DeepSeek cũng như paper để gấp rút sao chép được gì thì sao chép 😃))))
Nói chung là mấy ông Mỹ và Phương Tây panic cmnl trong mấy ngày qua vì ông DeepSeek AI Trung Quốc 😃))))

View attachment 8157089

Dĩ nhiên một số tiếng nói tỉnh táo nói ngược lại, điển hình là anh Alexandr Wang CEO gốc Trung của Scale AI, công ty chuyên làm dữ liệu huấn luyện thuê cho các cty train AI, khách của ảnh là OpenAI, Anthropic, Google và dĩ nhiên cả mấy cty TQ như Alibaba, Tencent, rồi cả … cty mẹ của DeepSeek là quỹ đầu tư High-Flyer (thuê Scale AI làm data cho mô hình AI tài chính). Anh này trong một buổi phỏng vấn có nói là (hình dưới còm): DeepSeek có tầm 50.000 con GPU NVIDIA H100 lận mà tụi nó không nói được do tụi nó sở hữu không chính thức vì bị Mỹ cấm vận mà.

Cá nhân mình trong vài tháng trước có chia sẻ cho mọi người rằng các cty AI Trung Quốc đã và đang thuê GPUs xịn từ các hạ tầng cho thuê GPUs cloud xịn xò ở các nước chung quanh. Ví dụ thuê GPUs của cty con GreenNode của VNG Việt Nam tại Thái Lan, thuê đám GPUs mà FPT nhập về kìa 😃)))) dự kiến thuê đám GPUs mà NVIDIA cung cấp cho Trung Tâm Dữ Liệu và Trung Tâm Nghiên Cứu AI ở Việt Nam 😃)) các thông tin này mai mình sẽ share full clip buổi nói chuyện cách đây vài tháng tại trường đầu tư Candela cho mọi người nghe thêm. Chuyện DeekSeek hôm nay thực ra giới làm AI đã dự đoán trước, chỉ là không biết nó sớm vậy thôi 😃))))

Doanh số bán card năm 2024 của Nvidia tới 1/4 là tới các cty datacenter offshore cho TQ tại Singapore 😃))))

Nên bảo Trung Quốc không có card xịn để train AI là câu chuyện gimmick marketing của mấy anh China kể để nghe nó kiểu Vượt-Nghèo-Học-Giỏi thôi trong khi mấy anh TQ có thiếu quái gì tiền, nghèo thì phải nói VN mới là nghèo kìa 😃))))

Làm AI có 2 giai đoạn, giai đoạn Training và giai đoạn Inference (chạy model), thực tế về mặt khoa học và kỹ thuật thì giai đoạn Training hoàn toàn có thể sử dụng GPUs on Cloud tức là xài remote bất cứ đâu trên thế giới được, thuê tầm vài trăm ngàn con xài trong vài tháng để train rồi ngưng, chi phí trả 1 cục, không vấn đề, do mạng mẽo không cần phải mạnh phải liên tục.

Nhưng giai đoạn Inference tức là chạy model và cung cấp dịch vụ AI cho mọi người chat public thì mệt mỏi hơn, số card không thể dự đoán trước mà users tăng bao nhiêu thì số card thuê phải tăng bấy nhiêu, mạng mẽo phải liên tục, phải nhanh, chứ chậm vài giây users chửi liền. Do đó phần tốn tiền kinh khủng là phần Inference chứ không phải phần Training, chi phí Training nó có thể dự đoán trước. Nên việc thuê GPUs tại các cloud offshore là rất khó khăn trong việc planning chi phí cũng như resources. Đông Users cái là biết nhau ngay, một trong số lí do DeepSeek phải Open Source là bởi cty mẹ High-Flyer không nhiều tiền như Microsoft và OpenAI để cung cấp free mãi con AI này đâu. Vì chi phí thuê GPUs cho Inference quá cao nếu trong tình trạng bị cấm vận như TQ nên mới có cái deal anh Jasen Huang sếp Nvidia qua Việt Nam lập Trung Tâm Dữ Liệu AI và Trung tâm Nghiên Cứu AI đó 😃))))) do mạng VN và Trung Quốc khác éo gì mạng Local đâu, mạng VN qua quốc tế thì ngon nhất ĐNÁ luôn, và ship card từ Đài Loan qua VN thì thôi rồi nó gần 😃)))) Này nói thêm vì nó liên quan với vụ DeepSeek ra mắt thực ra có lợi cho VN hơn 😃))))

Nói tiếp, mình cũng từng chia sẻ là việc Mỹ cấm vận GPU hiệu suất cao đối với TQ đã khiến TQ đi một con đường nguy hiểm hơn mà Mỹ không kiểm soát được, đó là tận dụng phong trào AI nguồn mở mà Meta của Mắc dẫn đầu để phát triển các mô hình AI Nguồn Mở Quy Mô Nhỏ (Small Language Model) được chuyên biệt hoá chức năng, và sử dụng được trên các thiết bị AI ở Local như dùng card GPU gaming RTX là đủ chạy hoặc chạy được trên mấy con Raspberry Pi hoặc chạy được trên điện thoại có chip NPU (Neural Processing Unit - chip chạy AI yếu hơn GPU nhưng vẫn chạy ổn). Sếp của Trung tâm AI Facebook (FAIR) giáo sư Yann LeCun có post cái tút confirm về ý này khi DeepSeek bùng nổ, DeepSeek sử dụng mô hình nguồn mở LLaMA của Meta cho việc huấn luyện AI DeepSeek.
Người Trung Quốc từ lúc mở cửa năm 1978 đến nay, luôn tập trung vào việc “làm sao để sản xuất lớn nhanh nhất nhiều nhất”, trái ngược với người Mỹ, là làm sao để pump market cap lên maximum có thể tức là khai mở thị trường lên đến cực hạn. Đây chính là điểm khiến Mỹ phải thương chiến với TQ, nghĩ coi mình thì lo mở rộng thị trường, nhưng thằng lòi bên kia đại dương chỉ chăm chăm lo ăn sao cho lớn vô miếng bánh mà mình mất công mở 😃)))) cáu vl 😃)))

Nên anh Trump mới cấm vận TQ, rồi cấm vận chip đối với TQ, mục tiêu là để ép và ngăn TQ cắn vô thị trường mà mấy anh Mỹ tốn công mở mà chưa kịp ăn. Âu là do bản chất cách làm ăn mấy trăm năm nay của 2 đế quốc thôi.

DeepSeek thể hiện rõ lối làm ăn theo hướng tập trung tối ưu đó của TQ ngay từ cách thức tổ chức công ty, team DeepSeek có dưới 200 người, nghề chính lại còn không phải là làm AI, mà là cty con của Cty quản lý quỹ đầu tư kỹ thuật (Quant Fund) High-Flyer, đám làm AI này dùng đám card thừa khi cty mẹ xài chạy mấy model financial xong thì xài, đặc biệt là team này ếu có ông PhD nào nữa, nhân sự cốt cán của team toàn là cử nhân thôi, lại còn đến từ các trường đại học chả phải top đầu như Thanh Hoa hay Bắc Đại nữa 😃)) Nên sản phẩm DeepSeek AI của họ dĩ nhiên là hướng tới tối ưu ngay từ đầu, chi phí sao cho rẻ nhất, bán được đại trà nhất, cắn vô to nhất miếng bánh AI mà người Mỹ đã pump lên 800% chỉ trong 2 năm.

Tóm lại nói dông dài về mặt kinh tế, tài chính và địa chính trị, để nói rõ tổng quan rằng người Mỹ đã ép người Trung Quốc tới điểm “cùng tất biến” 🙂 nên DeepSeek là kết quả nhãn tiền của chính sách o ép từ Mỹ thôi 🙂

Dù mình làm cho cty AI Mỹ nhưng mình cũng ếu ưa cái chính sách cấm vận chip này của Mỹ 🙂 mỗi lần train model AI phải connect qua GPUs farm của cty bên Mỹ khổ bỏ mie 🙁
Rồi giờ tới phần phân tích khoa học về các đột phá của DeepSeek AI 😃)))) bài dài quá rồi, lại phải cắt ra thành 1 bài khác 😃)))))

Các bạn nhớ like và share (nhớ share) post này để cứu reach dùm mình 🙁 dạo này Meta AI nó bóp reach mình quá rồi 😔((((((

Link bài gốc:
https://www.facebook.com/share/p/1AD6gaJ3tk/

Nguồn:tinhte.vn/thread/ai-deepseek-ai-su-troi-day-cua-ai-phuong-dong-hay-ai-trung-quoc-co-thuc-su-de-doa-phuong.3953394/