Tất tần tật những nâng cấp AI trên Google I/O 2024

24/05/2024 925

Mục lục

    Sự kiện Google I/O vừa kết thúc với hàng loạt thông báo về công nghệ AI. "Gã khổng lồ tìm kiếm" đã tập trung nâng cấp mô hình Gemini AI và tích hợp chúng vào các ứng dụng như Workspace và Chrome. Nếu bạn đã bỏ lỡ sự kiện trực tiếp, dưới đây là tất cả những thông tin mới nhất từ sự kiện Google I/O năm nay.

    Sự kiện Google ra mắt ngày 14/05 với hàng loạt thông báo về công nghệ AI

    Các nâng cấp về AI trong Google I/O 2024

    Bằng cách quay video, bạn có thể tìm kiếm thông tin bằng Google Lens

    Google Lens nay có thêm tính năng tìm kiếm qua video, không chỉ dựa trên hình ảnh.

    Google Lens đã tiến xa hơn bằng cách giới thiệu tính năng tìm kiếm không chỉ dựa trên ảnh mà còn dựa trên video. Điều đó có nghĩa là bạn có thể quay video về bất kỳ vật thể hoặc sự vật nào bạn muốn tìm kiếm, đặt câu hỏi trực tiếp trong video, và trí tuệ nhân tạo của Google sẽ nỗ lực trích xuất thông tin cần thiết từ web để đáp ứng nhu cầu tìm kiếm của bạn. Tính năng này không chỉ mở ra một cách tiếp cận mới đối với việc tìm kiếm thông tin mà còn tạo điều kiện cho sự tương tác tự nhiên hơn giữa con người và công nghệ, thúc đẩy sự tiện lợi và hiệu quả trong quá trình tìm kiếm và khám phá.

    Gemini có khả năng trả lời các câu hỏi về thư viện ảnh của bạn

     Trong mùa hè này, Google triển khai tính năng mới

    Trong mùa hè này, Google đang triển khai một tính năng mới có thể mang lại lợi ích lớn cho những người có bộ sưu tập ảnh từ hàng năm, thậm chí hàng thập kỷ. "Ask Photos" cho phép Gemini - một trong những mô hình AI hàng đầu của Google - xem xét thư viện ảnh của Google Photos của bạn để trả lời các câu hỏi. Tính năng này không chỉ hữu ích cho việc tìm kiếm ảnh của thú cưng. CEO Sundar Pichai đã minh họa điều này bằng cách hỏi Gemini về biển số xe của ông ta. Kết quả là câu trả lời đúng, được kèm theo một bức ảnh để ông ta có thể kiểm tra và xác nhận.

    Mô hình Gemini cao cấp nhất của Google đã trở nên mạnh mẽ và nhanh chóng hơn

     Google ra mắt mô hình AI mới trong dòng sản phẩm của họ: Gemini 1.5 Flash, tối ưu cho các tác vụ nhanh và tần suất cao với độ trễ thấp.

    Google đã ra mắt một mô hình AI mới trong dòng sản phẩm của mình: Gemini 1.5 Flash. Mô hình này có đa phương thức mạnh mẽ như Gemini 1.5 Pro, nhưng được tối ưu hóa cho "các tác vụ nhanh, tần suất cao, độ trễ thấp". Điều này khiến nó trở nên hiệu quả hơn trong việc đưa ra phản hồi nhanh chóng. Google cũng đã thực hiện một số cải tiến cho Gemini 1.5, nhằm cải thiện khả năng dịch thuật, suy luận và lập trình. Hơn nữa, Google thông báo rằng họ đã tăng gấp đôi khung ngữ cảnh của Gemini 1.5 Pro từ 1 triệu lên 2 triệu token.
    Gemini 1.5 Flash có vẻ tương đương với GPT-4o mới được OpenAI giới thiệu hôm qua, với khả năng tiếp nhận thông tin đầu vào đa phương thức. Tuy nhiên, để biết chính xác sự khác biệt về năng lực giữa hai mô hình này, cần phải chờ đợi thêm một thời gian.

    Gemini giúp người dùng giải quyết vấn đề trong các ứng dụng làm việc

     Google tích hợp mô hình ngôn ngữ hàng đầu Gemini 1.5 Pro vào sidebar của ứng dụng như Docs, Sheets, Slides, Drive và Gmail, tạo ra một trợ lý đa năng có khả năng trích xuất thông tin từ nhiều nguồn, bao gồm cả nội dung trong Drive.

    Google đang tích hợp mô hình ngôn ngữ phổ biến nhất của họ, Gemini 1.5 Pro, vào sidebar trong các ứng dụng như Docs, Sheets, Slides, Drive và Gmail. Khi được ra mắt với người dùng có tài khoản trả phí vào tháng sau, nó sẽ trở thành một trợ lý đa năng hơn trong các ứng dụng công việc, có khả năng trích xuất thông tin từ mọi nguồn, bao gồm cả nội dung trong Drive của bạn.
    Nó cũng có thể thực hiện một số công việc hộ bạn, như viết email kết hợp thông tin từ tài liệu bạn đang xem hoặc nhắc bạn sau này để trả lời email mà bạn đang xem. Một số người dùng thử nghiệm sớm đã có quyền truy cập vào các tính năng này, nhưng Google cho biết sẽ triển khai cho tất cả người dùng có tài khoản Gemini trả phí vào tháng sau.

    Tương lai của AI Star Trek của Google là dự án Astra

    Dự án Astra của Google là trợ lý AI đa phương thức, được kỳ vọng sẽ trở thành trợ lý ảo đa năng giúp bạn thực hiện mọi việc.

    Dự án Astra của Google là một trợ lý trí tuệ nhân tạo đa phương tiện, được hy vọng sẽ trở thành một trợ lý ảo đa năng, giúp bạn thực hiện nhiều công việc khác nhau. Nó có khả năng nhìn và hiểu những gì nó thấy thông qua camera thiết bị của bạn, ghi nhớ vị trí của các đồ vật và thậm chí làm việc thay bạn. Astra đang trở thành nguồn động viên cho nhiều demo ấn tượng nhất từ sự kiện I/O năm nay, và mục tiêu của Google với dự án này là biến nó thành một đại lý trí tuệ nhân tạo thực sự, không chỉ có khả năng nói chuyện mà còn có thể thực hiện công việc thay bạn.

    Cạnh tranh với Sora của OpenAI thông qua việc ra mắt Veo

    Veo của Google là mô hình AI tạo nội dung mới, tương tự như Sora của OpenAI, giúp tạo video 1080p từ văn bản, hình ảnh và video.

    Veo của Google đánh dấu sự ra đời của một công nghệ tiên tiến, một câu trả lời đáng chú ý cho Sora của OpenAI. Đây không chỉ là một mô hình trí tuệ nhân tạo tạo ra nội dung mới, mà còn là một công cụ mạnh mẽ giúp tạo ra các video độ phân giải 1080p từ các gợi ý được cung cấp từ văn bản, hình ảnh và video. Veo không chỉ đơn thuần tạo ra video mà còn cung cấp nhiều tùy chọn đa dạng cho kiểu dáng sản xuất, bao gồm quay phim trên không hoặc quay chậm, và có khả năng điều chỉnh với sự hỗ trợ từ nhiều gợi ý khác nhau.

    Công ty đã chọn cung cấp Veo cho một số nhà sáng tạo trên YouTube, đồng thời cũng đã chia sẻ công nghệ này với Hollywood để ứng dụng vào các dự án phim ảnh. Sự kết hợp giữa công nghệ tinh vi và sức mạnh sáng tạo của Veo hứa hẹn sẽ mở ra nhiều cánh cửa mới trong ngành công nghiệp giải trí và sản xuất video.

    Khả năng tạo chatbot tùy chỉnh cho Gemini được cung cấp bởi Gems

    Google đang triển khai Gems, một công cụ tạo chatbot tùy chỉnh

    Google đang triển khai một công cụ tạo chatbot tùy chỉnh mang tên Gems. Tương tự như các mô hình GPT tùy chỉnh của OpenAI, Gems cho phép người dùng chỉ đạo Gemini để tinh chỉnh cách nó phản hồi và chuyên môn của nó. Nếu bạn muốn nó trở thành một "huấn luyện viên chạy bộ tích cực và kiên quyết" với động lực và kế hoạch chạy bộ hàng ngày - một cơn ác mộng tệ nhất của tôi - bạn sẽ có thể thực hiện điều đó sớm (nếu bạn là người đăng ký Gemini Advanced).

    Gemini trở thành đối tượng trò chuyện tốt hơn

    Gemini Live, một tính năng mới, được thiết kế để làm cho cuộc trò chuyện với Gemini trở nên tự nhiên hơn.

    Tính năng mới Gemini Live được thiết kế để làm cho cuộc trò chuyện với Gemini trở nên tự nhiên hơn. Giọng nói của chatbot sẽ được cập nhật với sự thêm vào của cá tính, và người dùng có thể ngắt lời nó giữa câu hoặc yêu cầu nó xem qua camera điện thoại thông minh và cung cấp thông tin về những gì nó nhìn thấy trong thời gian thực. Gemini cũng đang được tích hợp mới để có thể cập nhật hoặc truy xuất thông tin từ Google Calendar, Tasks và Keep, sử dụng các tính năng đa phương thức để thực hiện điều này (như thêm chi tiết từ tờ rơi vào lịch cá nhân của bạn).

    Hỗ trợ người dùng giải toán với tính năng Khoanh vùng tìm kiếm

    Trên thiết bị Android, bạn có thể vẽ một vòng tròn quanh bài toán trên màn hình để nhận trợ giúp

    Nếu bạn đang sử dụng điện thoại hoặc máy tính bảng chạy hệ điều hành Android, bạn có thể vẽ một vòng tròn quanh một bài toán trên màn hình và nhận được sự trợ giúp để giải quyết nó. AI của Google sẽ không giải bài toán thay bạn - vì vậy không có việc hỗ trợ gian lận trong việc làm bài tập về nhà - nhưng nó sẽ phân tích bài toán thành các bước nhỏ để bạn dễ dàng tiếp cận hơn.

    AI được tích hợp vào Google Search để cải thiện trải nghiệm tìm kiếm

    Google sẽ phát hành

    Google sẽ ra mắt tính năng mới mang tên "AI Overviews", trước đây được biết đến với tên gọi "Search Generative Experience", dành cho người dùng tại Mỹ trong tuần này. Điều đặc biệt là, một phiên bản "chuyên biệt" của mô hình Gemini sẽ tự động tạo ra và điền thông tin vào các trang kết quả với các tóm tắt câu trả lời từ web. Đây là một bước tiến đáng chú ý, tương tự như những gì bạn thấy trong các công cụ tìm kiếm AI như Perplexity hoặc Arc Search, nơi mà mô hình AI tự động tạo ra và hiển thị những tóm tắt thông tin chi tiết và dễ hiểu từ nội dung trên web.

    Android sử dụng AI để phát hiện cuộc gọi lừa đảo

    Google thông báo rằng điện thoại Android sẽ sử dụng AI Gemini Nano để ngăn ngừa cuộc gọi lừa đảo.

    Google đã thông báo rằng điện thoại khởi chạy Android sẽ sử dụng khả năng của AI Gemini Nano để giúp người dùng tránh các cuộc gọi lừa đảo. Thiết bị sẽ theo dõi các dấu hiệu đáng ngờ, như các mẫu đàm thoại phổ biến của kẻ lừa đảo, và sau đó hiển thị cảnh báo thời gian thực như hình ảnh đã được cung cấp. Google hứa sẽ cung cấp thêm chi tiết về tính năng này vào cuối năm nay.

    Thiết bị chạy hệ điều hành Android sẽ có sự trang bị AI thông minh hơn

    Google thông báo Gemini sẽ cho phép người dùng đặt câu hỏi về video và tự động trả lời dựa trên phụ đề.

    Google đã thông báo rằng trong tương lai gần, Gemini sẽ cho phép người dùng đặt câu hỏi về video trên màn hình và nó sẽ trả lời dựa trên phụ đề tự động. Đối với người dùng Gemini Advanced có phiên bản trả phí, nó cũng có khả năng đọc PDF và cung cấp thông tin. Những cập nhật đa phương thức này và nhiều tính năng khác cho Gemini trên Android sẽ được ra mắt trong vài tháng tới.

    Trình duyệt Chrome được bổ sung một trợ lý AI

    Google sẽ tích hợp Gemini Nano, phiên bản thu gọn của mô hình Gemini, vào trình duyệt Chrome trên máy tính để bàn

    Google đã công bố rằng họ sẽ tích hợp Gemini Nano, một phiên bản thu gọn của mô hình Gemini, vào trình duyệt Chrome trên máy tính để bàn. Trợ lý tích hợp này sẽ sử dụng trí tuệ nhân tạo trên thiết bị để hỗ trợ người dùng trong việc tạo ra văn bản cho các bài đăng trên mạng xã hội, đánh giá sản phẩm và nhiều nội dung khác mà không cần rời khỏi trình duyệt Chrome. Điều này mở ra một tiềm năng mới cho việc sử dụng trí tuệ nhân tạo trực tiếp trên máy tính để bàn và tạo ra trải nghiệm người dùng mạnh mẽ và thuận tiện hơn khi làm việc trên web.

    Google cải thiện công cụ watermark - AI SynthID

    Google mở rộng khả năng của SynthID bằng cách nhúng đánh dấu nước vào nội dung từ trình tạo video Veo và nhận diện video từ trí tuệ nhân tạo.

    Google đã thông báo rằng họ đang mở rộng khả năng của SynthID - họ nói rằng công cụ watermark sẽ được nhúng vào nội dung được làm bằng trình tạo video mới Veo và hiện tại nó cũng có khả năng nhận diện video được tạo ra bởi trí tuệ nhân tạo.

    Bên cạnh việc cập nhật thêm nhiều thông tin công nghệ hữu ích, để trải nghiệm hàng loạt ứng dụng độc đáo trên iOS/Android, bạn có thể đến 24hStore và sắm ngay một chiếc điện thoại mới từ các thương hiệu nổi tiếng như Samsung, Apple, Xiaomi, Oppo,... Bạn cũng đừng ngần ngại liên hệ qua hotline 1900.0351, đội ngũ tư vấn luôn sẵn sàng cung cấp cho bạn mọi thông tin về sản phẩm nhanh chóng.

    Support Zalo
    Chat Zalo (8h - 22h)
    Hotline
    1900 0351 (8h - 22h)