Vượt mặt Gemini và ChatGPT! Đánh giá chuyên sâu về Qwen của Alibaba: miễn phí, có thể trích dẫn, còn có thể tạo nguồn thông tin Alpha trên web thời gian thực chỉ với một cú nhấp chuột
Qwen của Alibaba đã bổ sung các tính năng tạo trang web và podcast chỉ với một cú nhấp chuột. Trong các thử nghiệm, Qwen và Gemini đều đứng đầu về độ chính xác, Qwen vượt trội về độ sâu nghiên cứu và khả năng xuất ra trang web, trong khi Gemini có lợi thế về chất lượng đa phương tiện. Tóm tắt được tạo bởi Mars AI. Nội dung tóm tắt này do mô hình Mars AI tạo ra, độ chính xác và đầy đủ của nó vẫn đang trong quá trình cải tiến và cập nhật.
Nghiên cứu sâu Qwen của Alibaba có thể tạo trang web và podcast thời gian thực chỉ trong vài giây
Nghiên cứu sâu Qwen của Alibaba hiện có thể chuyển đổi báo cáo thành trang web thời gian thực và podcast chỉ với một cú nhấp chuột. Dưới đây là so sánh dịch vụ miễn phí này với Gemini, ChatGPT và Grok.
Tóm tắt ngắn gọn
- Alibaba đã nâng cấp Qwen Deep Research, bổ sung tính năng tạo trang web và podcast chỉ với một cú nhấp chuột.
- Trong thử nghiệm, Qwen và Gemini ngang nhau về độ chính xác, cả hai đều vượt trội hơn ChatGPT và Grok.
- Tổng thể, Qwen chiến thắng về chiều sâu nghiên cứu và khả năng xuất ra trang web có thể chia sẻ, trong khi Gemini dẫn đầu về chất lượng đa phương tiện.
Đội ngũ nghiên cứu AI chuyên biệt của Alibaba, Qwen, tuần trước đã phát hành bản nâng cấp lớn cho chatbot AI của mình, cho phép người dùng tạo ra các tài liệu nghiên cứu toàn diện về bất kỳ chủ đề nào.
Sau đó, bạn chỉ cần vài cú nhấp chuột để dễ dàng chuyển đổi các tài liệu này thành trang web rõ ràng hoặc podcast đa vai trò.
Qwen Chat có giao diện và trải nghiệm sử dụng tương tự như ChatGPT, DeepSeek hoặc Claude, và được cung cấp miễn phí trên toàn cầu.

Tính năng mới dựa trên ba mô hình mã nguồn mở phối hợp: Qwen3-Coder chịu trách nhiệm phân tích cấu trúc trang web, Qwen-Image tạo biểu đồ nhúng, Qwen3-TTS điều khiển phát thanh động.
Mặc dù dựa trên các mô hình mã nguồn mở, trải nghiệm end-to-end — bao gồm thực hiện nghiên cứu, triển khai trang web và tạo âm thanh — đều được Qwen vận hành dưới dạng dịch vụ được lưu trữ.
Quy trình làm việc bắt đầu từ giao diện Qwen Chat, nơi người dùng đặt câu hỏi nghiên cứu. Sau khi làm rõ ban đầu, AI sẽ thực hiện tìm kiếm trên web, phân tích các nguồn dữ liệu công khai và cuối cùng tạo ra báo cáo hoàn chỉnh kèm trích dẫn.

Sau đó xuất hiện hai tùy chọn mới: “Phát triển trang web” có thể tự động tạo trang web động chuyên nghiệp, do Qwen triển khai và lưu trữ, bao gồm cả biểu đồ nhúng.
Tùy chọn “Podcast” cung cấp cuộc thảo luận âm thanh với nhiều vai trò động, có 17 giọng phát thanh viên và 7 tông phụ để lựa chọn.

Phần kiểm tra mô hình
Để đánh giá hiệu suất của Qwen như một công cụ nghiên cứu, chúng tôi đã chạy cùng một truy vấn nghiên cứu phức tạp trên Qwen, Gemini, ChatGPT và Grok. Nhiệm vụ yêu cầu phân tích các lập luận về sự tồn tại của Chúa trong lĩnh vực triết học và khoa học (nội dung cụ thể có thể xem trên kho GitHub), mỗi mô hình phải tạo ra báo cáo nghiên cứu hoàn chỉnh. Đánh giá bao gồm năm tiêu chí: độ chính xác của lập luận và trích dẫn, mức độ đầy đủ của thông tin, độ rõ ràng trong diễn giải, chiều sâu tư duy và chất lượng tổng thể.
Tóm tắt: Qwen Deep Research vượt trội về chiều sâu phân tích, trích dẫn tài liệu và tính năng tự động tạo trang web độc quyền, là lựa chọn lý tưởng cho học giả và nhà sáng tạo. Nó cũng là giải pháp thay thế miễn phí tích hợp tốt nhất cho các nhà nghiên cứu. Tuy nhiên, Gemini vẫn dẫn đầu về chất lượng âm thanh và video, ChatGPT và Grok phù hợp cho sử dụng hàng ngày, nhưng ChatGPT thiếu phạm vi bao phủ của Qwen, còn Grok không đạt trình độ thủ công của Google.
Đánh giá chi tiết như sau:
Độ chính xác: Lập trường triết học và quan điểm khoa học có được trình bày chính xác và trích dẫn nguồn hợp lệ không?
Qwen nắm bắt chi tiết một cách chính xác. Khi thảo luận về lập luận vũ trụ luận, nó trích dẫn chính xác các tài nguyên học thuật như “Tại sao tôi không phải là người theo đạo Thiên Chúa” của Bertrand Russell, cũng như nội dung tranh luận giữa William Lane Craig và Peter Atkins. Khác với các công cụ nghiên cứu AI khác như Perplexity, Grok, nguồn tham khảo của Qwen chủ yếu đến từ các tổ chức học thuật uy tín (như Stanford, Princeton, Oxford, Drew University), đôi khi thậm chí là tài liệu gốc, đồng thời kịp thời bổ sung các phân tích liên quan từ Quora và Facebook.
Gemini đạt độ chính xác tương đương với 94 trích dẫn đánh số (một số trích dẫn lặp lại ở các chương khác nhau của báo cáo).
Cả hai đều phân biệt chính xác các khái niệm, không mắc lỗi nhầm lẫn giữa chủ nghĩa cơ bản Kinh Thánh với thần luận nói chung.
ChatGPT quá phụ thuộc vào “Bách khoa toàn thư Triết học Stanford” và có xu hướng đơn giản hóa quá mức. Grok có thể đưa ra tóm tắt chính xác nhưng attribution mơ hồ, thường sử dụng các diễn đạt chung như “có thể truy nguyên về Plato, Aristotle”.
Kết quả: Qwen và Gemini đồng hạng xuất sắc nhất.
Mức độ đầy đủ của thông tin: Nghiên cứu có chi tiết không?
Qwen là mô hình duy nhất thiết lập chương riêng “Phê phán chủ nghĩa vô thần: Trách nhiệm chứng minh và bản chất bằng chứng”, khám phá các khía cạnh tranh luận mà các công cụ khác chưa đề cập. Nó phân biệt rõ “chủ nghĩa vô thần yếu” (nghi ngờ về sự tồn tại của thần) và “chủ nghĩa vô thần mạnh” (khẳng định thần không tồn tại), đồng thời trích dẫn các tiêu chuẩn “vượt quá nghi ngờ hợp lý” của các nhà tư tưởng vô thần như Gary Wittenberger.

Dưới đây là ví dụ nội dung do Qwen tạo ra: “Một trong những vấn đề gây tranh cãi nhất là trách nhiệm chứng minh. Bertrand Russell đã minh họa quan điểm này bằng phép ẩn dụ nổi tiếng về ấm trà: cũng như ông không thể chứng minh không tồn tại một ấm trà nhỏ quay quanh Mặt Trời giữa Trái Đất và Sao Hỏa, ông cho rằng người theo thần luận cũng không thể chứng minh sự tồn tại của Chúa.”
Các mô hình khác không đi sâu vào tranh luận về trách nhiệm chứng minh như vậy, vì đây có thể không phải là chủ đề cốt lõi. Gemini tiếp cận chiều sâu này bằng cách bao quát lập luận về ý thức và phê phán “khoảng trống thần học”. ChatGPT bao gồm các lập luận thực dụng như Cược Pascal và thảo luận về tác động thực tế đối với đạo đức và chính sách. Grok giữ cho nội dung ngắn gọn (khoảng một phần ba độ dài báo cáo của Qwen), nhưng bổ sung bảng tóm tắt hữu ích.
Kết quả: Qwen có lập luận chi tiết nhất.
Độ rõ ràng: Nội dung nghiên cứu được trình bày như thế nào?
Grok sử dụng bảng đơn giản để phân loại theo loại (lập luận triết học vs lập luận khoa học, ủng hộ vs phản đối). Các chương được phân chia rõ ràng: “Lập luận triết học”, “Lập luận khoa học”, “Chi tiết bất ngờ”, ai cũng có thể xem nhanh.
ChatGPT sử dụng nhiều chú thích trong ngoặc để làm cho các khái niệm phức tạp dễ hiểu hơn. Ví dụ: “Nếu sự tồn tại của Chúa là có thể (tức là logic nhất quán), thì Chúa nhất định tồn tại.” Trong đó “(tức là logic nhất quán)” giúp độc giả không chuyên triết học dễ hiểu hơn.
Qwen và Gemini có phong cách học thuật hơn. Qwen tổ chức nội dung bằng các tiêu đề chính thức như “Lập luận thần luận: Cơ sở vũ trụ luận và mục đích luận”, tuy chính xác nhưng khiến việc đọc trở nên khó tiếp cận. Gemini sử dụng đánh số La Mã (I. Giới thiệu, II. Lập luận triết học), cấu trúc rõ ràng nhưng cần đọc kỹ.
Cả hai đều hướng đến các nhà nghiên cứu nghiêm túc, trong khi ChatGPT và Grok hướng đến đối tượng rộng hơn.
Kết quả: ChatGPT trình bày thông tin rõ ràng nhất, Grok đứng thứ hai.
Đa dạng nguồn: Nghiên cứu có bao gồm nhiều truyền thống, ngành học và góc nhìn không?
Qwen kết hợp triết học kỹ thuật (lập luận Kalam, nguyên lý đủ lý do, logic mô thức S5) với tranh luận khoa học tiên tiến (điểm kỳ dị vụ nổ lớn, dao động lượng tử, chức năng DNA). Nó đảm bảo sự hiểu biết thông qua giải thích cụ thể và cung cấp ví dụ nền tảng cho các lập trường và lập luận.
Ví dụ khi giải thích lập luận thần luận, Qwen xây dựng bảng liệt kê rõ ràng các tiền đề, quan điểm phê phán và học giả ủng hộ của các lập luận cốt lõi.

Gemini đạt trình độ tương đương bằng cách bao quát lập luận về ý thức mà hầu hết các mô hình khác bỏ qua, đồng thời cảnh báo rõ ràng hơn về khiếm khuyết lập luận “khoảng trống thần học”.
ChatGPT cung cấp giá trị độc đáo với chương “tác động thực tế” lớn, thảo luận về cách tranh luận này ảnh hưởng đến chính sách giáo dục khoa học, quy định đạo đức sinh học và thái độ cá nhân đối với cái chết. Phần này ít học thuật hơn nhưng thực tế hơn, vẫn liên quan đến việc hiểu bản chất nghiên cứu.
Grok bao quát các lập luận chính nhưng thiếu chi tiết, đề cập đến fine-tuning và nguyên lý nhân trắc nhưng không trích dẫn số liệu cụ thể hoặc đi sâu phân tích.
Kết quả: Qwen và Gemini thể hiện tốt nhất.
Chất lượng tổng thể: Xét về độ nghiêm túc, mạch lạc và giá trị học thuật, bạn sẽ muốn trích dẫn nghiên cứu nào?
Báo cáo do Qwen và Gemini tạo ra đều đạt tiêu chuẩn có thể nộp cho giảng viên học thuật. Lợi thế độc đáo của Qwen là cân bằng chiều sâu giữa lập luận thần luận và phê phán vô thần, bao gồm chương về trách nhiệm chứng minh. Điểm mạnh của Gemini là kết hợp khoa học tiên tiến (ý thức, tiến hóa, vũ trụ học) với lập luận triết học.
ChatGPT có giá trị giảng dạy nổi bật — rất phù hợp cho việc giảng dạy hoặc hiểu tác động thực tế. Grok có thể dùng làm hướng dẫn nhập môn đáng tin cậy hoặc tham khảo nhanh.
Nói cách khác, nếu bạn chỉ muốn nhanh chóng nắm bắt kiến thức cho cuộc trò chuyện, thể hiện kiến thức trong buổi hẹn hò, hoặc làm mới trí nhớ trước khi trình bày về chủ đề đã biết, ChatGPT và Grok có thể phù hợp hơn
Điểm cuối cùng:
Qwen: 9/10
Gemini: 9/10
ChatGPT: 8/10
Grok: 6/10
So tài tính năng podcast: Qwen đối đầu Gemini
Tính năng podcast của Qwen giúp nó cạnh tranh trực tiếp với Google NotebookLM và Gemini, những người tiên phong trong tổng hợp âm thanh do AI tạo ra.
Khác với Gemini, Qwen cung cấp nhiều lựa chọn giọng phát thanh viên. Cấu trúc của nó chắc chắn: hai phát thanh viên AI sẽ thực hiện cuộc đối thoại thực sự về nghiên cứu của bạn, thay vì chỉ chuyển văn bản thành giọng nói.

Tuy nhiên, chất lượng âm thanh không ổn định: một số giọng tự nhiên, phần lớn lại mang âm thanh robot cứng nhắc và giọng lạ. Trong quá trình thử nghiệm, một phát thanh viên nam liên tục thốt lên “ồ ồ ồ” vì “quá xúc động”, vợ tôi đi ngang qua còn hỏi tôi có đang xem nội dung khiêu dâm không.
Bạn có thể tìm được giọng nói mượt mà hơn thông qua thử nghiệm nhiều lần, khi đó chất lượng sẽ được cải thiện đáng kể.

Tuy nhiên, Gemini và NotebookLM vượt trội hơn Qwen trong lĩnh vực này. Tính năng tổng hợp âm thanh của Google (được giới thiệu trên NotebookLM vào tháng 9/2024, mở rộng sang Gemini vào tháng 3/2025) thể hiện đặc điểm giống con người đáng kinh ngạc, giọng nói tự nhiên, có đối thoại tranh luận và thậm chí cả yếu tố hài hước.
Podcast của Gemini mang lại cảm giác con người và hấp dẫn hơn.

Nền tảng này còn cung cấp tính năng tạo video, là lợi thế rõ rệt cho người dùng thích tiếp thu chủ đề qua hình ảnh và âm thanh thay vì đọc văn bản dài.
Qwen không thể thực hiện chức năng này — thực tế các mô hình khác cũng không có.
Nếu bạn cần giải pháp đa phương tiện hoàn chỉnh bao gồm âm thanh, video và trang web, Gemini hiện là lựa chọn toàn diện nhất.
Lợi thế tạo trang web
Ngoài chất lượng nghiên cứu, điểm mạnh của Qwen là khả năng tự động tạo trang web, điều mà các mô hình khác chưa làm được.
Sau khi hoàn thành nghiên cứu, bạn có thể chuyển nó thành một trang web được lưu trữ thời gian thực. Không phải PDF hay Google Docs — mà là một trang web thực sự với tiêu đề, bảng định dạng, trích dẫn siêu liên kết nhúng.
Giao diện người dùng giống Kimi, có bố cục rõ ràng, thiết kế đáp ứng và hỗ trợ chia sẻ ngay lập tức.

Người dùng ChatGPT phải sao chép thủ công vào trình xây dựng trang web.
Gemini giữ nội dung trong Docs. Grok chỉ xuất ra văn bản. Chỉ Qwen có thể tự động tạo đầu ra sẵn sàng cho trang web.
Lợi thế quy trình làm việc này thực sự là điểm cộng lớn.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
Giá BTC hướng tới mức đóng cửa hàng tháng kỷ lục: 5 điều cần biết về Bitcoin trong tuần này
Canada thúc đẩy khung pháp lý stablecoin trước bản cập nhật ngân sách liên bang vào tuần tới: Bloomberg
Canada được cho là đã đẩy nhanh tiến trình xây dựng bộ quy tắc về stablecoin và có thể sẽ công bố chi tiết trong ngân sách liên bang ngày 4 tháng 11. Động thái này diễn ra sau các nỗ lực chính sách rộng rãi về tiền điện tử neo giá theo fiat tại các khu vực như Hoa Kỳ, Nhật Bản, Hong Kong và châu Âu.

American Bitcoin của anh em nhà Trump mua vào 160 triệu USD BTC, lọt vào top 25 kho bạc công khai hàng đầu
Nền tảng khai thác và tích lũy này dự định công bố các bản cập nhật “Satoshis per Share” để hiển thị số lượng bitcoin hỗ trợ cho mỗi cổ phiếu. Chủ tịch điều hành Asher Genoot cho biết hoạt động khai thác bitcoin nội bộ của American Bitcoin mang lại lợi thế về chi phí so với các công ty chỉ mua bitcoin trên thị trường mở.

Standard Chartered cho biết bitcoin có thể sẽ không bao giờ giảm xuống dưới 100.000 USD nữa 'nếu tuần này diễn ra thuận lợi'
Geoffrey Kendrick của Standard Chartered cho biết việc căng thẳng Mỹ-Trung giảm bớt đã nâng cao tâm lý thị trường, với tỷ lệ bitcoin-vàng phục hồi lên mức đã thấy trước đợt bán tháo do thuế quan ngày 10 tháng 10. Ông nói rằng một mức cao lịch sử mới của bitcoin sẽ đánh dấu sự kết thúc của lý thuyết chu kỳ halving, đồng thời bổ sung rằng "nếu tuần này diễn ra thuận lợi, bitcoin có thể sẽ KHÔNG BAO GIỜ giảm xuống dưới 100,000 USD nữa."

