Smart TV: додатки шпигують за вами для навчання ШІ

Smart TV: додатки шпигують за вами для навчання ШІ 2

Збір даних для ШІ: Нові горизонти або тіньові практики?

Сфера збору загальнодоступного контенту для навчання моделей штучного інтелекту (ШІ) стрімко розвивається. Дедалі частіше увагу таких компаній привертають застосунки для Smart TV та подібні цифрові платформи, відкриваючи нові, але й потенційно суперечливі, можливості.

Мотивація компаній та роль користувачів

Нагальна потреба компаній у значних обсягах даних для тренування ШІ спонукає їх шукати новітні джерела. Одним із підходів є використання інтернет-з’єднань користувачів в обмін на незначні переваги. Це може бути як зменшення кількості реклами, так і надання безкоштовного доступу до стрімінгових сервісів. Компанія Bright Data, відома своєю глобальною проксі-мережею для збору публічного веб-контенту, пропонує клієнтам можливість економії на перегляді телевізора шляхом добровільної участі в цій мережі. Згідно з останніми даними, код, пов’язаний з Bright Data, був виявлений у деяких застосунках для Smart TV. На запити щодо цієї практики багато розробників або ухилялися від коментарів, або навіть видаляли інтеграцію проксі-сервісу.

Bright SDK: Монетизація користувачів чи прозорість?

Bright Data позиціонує свою платформу як систему «доставки даних», яка трансформує процес веб-скрейпінгу (автоматизованого збору даних з вебсайтів) у структурований потік інформації. Рекламні матеріали обіцяють «100%» монетизацію користувачів завдяки технології Bright SDK, забезпечуючи глобальне охоплення з мінімальним впливом на звичний досвід користувача. Цей SDK може бути інтегрований у застосунки Smart TV. Користувачам, як правило, пропонують погодитися на участь у проксі-мережі перед активацією. Після згоди, їхнє інтернет-з’єднання може використовуватися для маршрутизації веб-трафіку, який потім надходить на сервери Bright Data. Ці дані використовуються компаніями для навчання ШІ-моделей та розвитку великих мовних моделей.

Анонімність та масштаби мережі

На одному з галузевих вебінарів кілька років тому, головний операційний директор Bright Data, Аріель Шульман, наголошував, що SDK нібито не відстежує користувачів безпосередньо. Код, за його словами, працює в анонімному фоновому режимі, а діяльність веб-краулерів складно відстежити через використання розподілених IP-адрес домашніх користувачів. Bright Data заявляє, що їхня проксі-мережа охоплює приблизно 150 мільйонів вузлів, що включає не лише Smart TV, але й програмне забезпечення на ПК та мобільних пристроях.

Your smart TV may be crawling the web for AI | Some TV apps let you watch programming with fewer ads, as long as you allow your TV to participate in a global proxy network
byu/Hrmbee intechnology

Думка UA Finansy: Ситуація з інтеграцією проксі-мереж у Smart TV-застосунки підкреслює зростаючу вартість даних для розвитку ШІ. Це змушує технологічні компанії шукати інноваційні, хоча й потенційно контроверсійні, шляхи їх здобуття, що може вплинути на баланс між інтересами розробників та приватністю користувачів.

Інформація підготовлена на основі матеріалів: itc.ua

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *