21 лютого китайський стартап DeepSeek оголосив, що зробить код своїх моделей штучного інтелекту доступним для громадськості, підтверджуючи свою прихильність розвитку штучного інтелекту з відкритим кодом. Ця ініціатива дозволить будь-кому завантажувати, змінювати або покращувати код, який підтримує R1 та інші платформи.
Зареєструватися
Ключові факти
- Компанія поділилася на платформі соціальних медіа X, що має намір оприлюднити основні коди та дані для громадськості наступного тижня, описавши цю дію як «невеликий, але щирий крок вперед», до якого вона підійде «з повною прозорістю».
- «Ці скромні будівельні блоки нашого онлайн-сервісу були задокументовані, реалізовані та перевірені в реальному середовищі», — зазначено в заяві.
- Стартап має намір зробити свої сховища коду доступними для всіх розробників і дослідників.
- Це оголошення відбулося після запуску DeepSeek нового алгоритму під назвою Native Sparse Attention (NSA) 18 лютого.
- Очікується, що код з відкритим вихідним кодом забезпечить структуру, необхідну для підтримки моделей ШІ, які DeepSeek вже оприлюднив.
- За останній місяць кількість користувачів DeepSeek значно зросла. Зараз він є найпопулярнішим сервісом чат-ботів у Китаї, станом на 11 січня щодня налічуючи 22,2 мільйона активних користувачів.
- DeepSeek прагне продовжити свою місію, опублікувавши базовий код, дані, використані для його створення, а також методи розробки та керування цим кодом.
Контекст
У січні DeepSeek здивувала світову спільноту штучного інтелекту, представивши свою модель R1 з відкритим вихідним кодом, яка конкурує із західними системами за продуктивністю, але є більш економічною для розробки.
Прихильність компанії відкритому коду відрізняє її від більшості фірм у Китаї, які, як і їхні американські колеги, схильні віддавати перевагу моделям із закритим кодом. Засновник DeepSeek Лян Венфен згадав у рідкісному інтерв’ю китайським ЗМІ в липні 2024 року, що компанія не зосереджена на комерціалізації своїх моделей ШІ.
Випуск коду може посилити конкуренцію між Сполученими Штатами та Китаєм у пошуках подальшого розвитку моделей ШІ. Роблячи свої секрети кодування загальнодоступними, DeepSeek сприяє ширшому впровадженню своєї технології, що вже викликає занепокоєння щодо безпеки серед урядів у всьому світі.