Google AI Ultra và VEO 3: Trải nghiệm AI cao cấp cho người sáng tạo nội dung
Google AI Ultra là gói dịch vụ cao cấp nhất của Google, tích hợp những công nghệ AI tiên tiến như Gemini 2.5, Veo 3, Imagen 4, Flow, Whisk, NotebookLM và nhiều công cụ hỗ trợ sáng tạo, lập trình và nghiên cứu. Gói này lý tưởng cho nhà phát triển, nhà sáng tạo nội dung, nhà nghiên cứu và người dùng chuyên nghiệp, đi kèm với YouTube Premium và 30TB dung lượng lưu trữ.
VEO 3 của Google là gì?
Veo 3 là mô hình tạo video mới nhất của Google, được ra mắt tại Google I/O 2025. Nó cho phép người dùng biến văn bản hoặc hình ảnh thành video chất lượng cao với âm thanh nguyên bản, bao gồm hội thoại, tiếng động môi trường và nhạc nền đồng bộ. Veo 3 hiểu rõ ngữ cảnh lời nhắc, giúp tái hiện các câu chuyện một cách sống động và chân thực.
Google I/O 2025: Các tính năng mới của Gemini, Veo 3, Imagen 4
Veo 3, Imagen 4, Lyria 2 và Flow: AI dành cho người sáng tạo
Veo 3 là mô hình tạo video AI mới nhất của Google, nổi bật tại Google I/O 2025. Đây là công cụ tiên phong biến văn bản hoặc hình ảnh thành video chất lượng cao với âm thanh sống động, bao gồm lời thoại nhân vật, âm thanh môi trường và nhạc nền đồng bộ.
- Tính năng nổi bật:
- Hiểu lời nhắc ngữ nghĩa để kể chuyện mượt mà
- Hỗ trợ chuyển động camera, thêm/xoá đối tượng, mở rộng khung hình
- Kiểm soát phong cách qua ảnh tham chiếu
- Hiện khả dụng cho người đăng ký Google AI Ultra tại Hoa Kỳ và người dùng doanh nghiệp thông qua Vertex AI.
- Imagen 4: Mô hình tạo hình ảnh mới nhất, hỗ trợ độ phân giải 2K, chi tiết sắc nét, hiển thị văn bản chuẩn xác – phù hợp tạo thiệp, poster, truyện tranh.
- Flow: Công cụ dựng cảnh điện ảnh kết hợp Veo, Imagen và Gemini – cho phép mô tả bằng ngôn ngữ tự nhiên được chuyển thành video mượt mà.
- Lyria 2: AI tạo nhạc tương tác theo thời gian thực, tích hợp trong YouTube Shorts và Vertex AI qua API.
Cải tiến ứng dụng Deep Research và Gemini
- Deep Research: Từ ngày 20/5/2025, người dùng có thể tải lên tài liệu cá nhân như PDF, hình ảnh để tạo báo cáo phân tích tổng hợp, kết hợp dữ liệu riêng với dữ liệu công khai.
- Tích hợp chặt chẽ với Google Drive, Gmail để sắp xếp và tìm kiếm tài liệu hiệu quả hơn.
- Canvas trong Gemini: Cho phép tạo đồ họa thông tin, số liệu và âm thanh theo phong cách podcast bằng 45 ngôn ngữ. Hỗ trợ mô tả thành mã hoá nhanh chóng với Gemini 2.5.
Gemini Live: Camera, Chia sẻ màn hình và Tích hợp hệ sinh thái
- Từ ngày 20/5/2025, Gemini Live hỗ trợ tương tác trực tiếp với môi trường thông qua camera điện thoại. Người dùng có thể hướng camera vào vật thể và trò chuyện cùng AI về chúng theo thời gian thực.
- Hỗ trợ chia sẻ màn hình trên Android và iOS.
- Sắp tới, Gemini Live sẽ kết nối với ứng dụng như Google Calendar, Google Maps để tạo sự kiện, gợi ý địa điểm, kiểm soát dữ liệu kết nối qua cài đặt riêng.
Câu đố tương tác và bản cập nhật mô hình Gemini 2.5
- Gemini hỗ trợ tạo câu đố tương tác với phản hồi tức thì, giúp cá nhân hóa quá trình học tập. Tính năng đã khả dụng toàn cầu.
- Gemini 2.5 Pro được cập nhật với khả năng xây dựng ứng dụng web, hỗ trợ mã hóa phức tạp và hiểu ngữ cảnh dài lên đến 1 triệu token. Được ưa chuộng trong lĩnh vực giáo dục và lập trình.
- Chế độ Deep Think: Tính năng thử nghiệm giúp mô hình đánh giá nhiều giả thuyết trước khi trả lời – cải thiện hiệu suất trong toán học và lập trình.
Tổng kết
Tâm điểm của Google I/O 2025 là Veo 3 – bước tiến đột phá trong công nghệ tạo video bằng AI. Với khả năng hiểu sâu ngữ cảnh, dựng video sắc nét có âm thanh tự nhiên, Veo 3 mở ra kỷ nguyên mới cho sáng tạo nội dung. Khi kết hợp cùng Gemini 2.5, Imagen 4 và Flow trong gói Google AI Ultra, người dùng có trong tay bộ công cụ toàn diện để làm phim, thiết kế, lập trình và nghiên cứu mạnh mẽ nhất hiện nay.
Đánh giá
There are no reviews yet