додому Останні новини та статті Перші кроки Gemini: Автоматизація завдань на телефонах повільна, але показує майбутнє

Перші кроки Gemini: Автоматизація завдань на телефонах повільна, але показує майбутнє

Google Gemini тепер здатний автоматизувати завдання безпосередньо у програмах на телефонах Pixel і Galaxy. Перші тести демонструють незграбну, але функціональну версію того, що може стати революційним досвідом використання ІІ-помічника. Хоча в даний момент можливості обмежені базовими функціями, такими як замовлення їжі та виклик таксі, здатність ІІ самостійно орієнтуватися в інтерфейсах додатків є значним стрибком вперед — навіть якщо поточна продуктивність далека від ідеалу.

Чому це важливо

Протягом багатьох років смартфонівські помічники покладалися на голосові команди та зумовлені інтеграції. Автоматизація завдань Gemini принципово відрізняється: вона безпосередньо управляє додатками, натискаючи кнопки, прокручуючи меню і приймаючи рішення, як це зробив би людина. Це має наслідки, що виходять за межі зручності. Це натякає на майбутнє, в якому ІІ автономно виконує рутинні мобільні завдання, звільняючи користувачів для складніших занять. Але поточна реалізація показує, наскільки далеко ми від цієї реальності.

Повільно, але функціонально

Тестування показує, що Gemini помітно повільніше, ніж звичайний користувач. Замовлення вечері через Uber Eats зайняло майже дев’ять хвилин, оскільки ІІ відчував труднощі з навігацією по меню. Система за замовчуванням працює у фоновому режимі, дозволяючи їй працювати без прямого контролю, але також робить її непрозорою. Журнали текстових логів показують хід думок ІІ («Вибір другої порції курки теріяки»), що може здатися захоплюючим одним, а неефективним іншим.

Точність та обмеження

Незважаючи на повільність, Gemini напрочуд точний. У ході тестів він рідко завершував замовлення без перевірки користувачем, а помилки зазвичай виникали на ранніх етапах процесу (наприклад, були потрібні дозволи на геолокацію). Особливо вражаючим досягненням було планування поїздки в аеропорт через Uber, доступ до календаря та даних про рейси для оптимального часу відправлення.

Однак продуктивність ІІ залежить від дизайну додатків. Інтерфейси, орієнтовані людей, перевантажені рекламою і непотрібними візуальними елементами, знижують ефективність. Google визнає це, припускаючи, що поточний підхід є тимчасовим рішенням, поки розробники додатків не приймуть більш зручні протоколи для ІІ, такі як Model Context Protocol (MCP).

Майбутнє дизайну додатків

Якби програми розроблялися для ІІ, вони виглядали б радикально інакше. Основна увага змістилася б із візуального безладу на структуровані дані. Поточні труднощі наголошують на тому, що найбільш ефективна автоматизація з використанням ІІ вимагає інфраструктури, не оптимізованої для взаємодії з людиною.

Ця версія автоматизації завдань відчувається як важливий перший крок до нового способу використання мобільних асистентів – незграбний, повільний, але досить перспективний.

Розробка автоматизації завдань Gemini – це важливий крок на шляху до повністю інтегрованих ІІ-помічників, навіть якщо поточна версія недосконала. Головний висновок полягає в тому, що управління програмами на основі ІІ тепер можливе, і його розвиток змінить нашу взаємодію з телефонами.

Exit mobile version