Facebook відкриває для кожного свого програмне забезпечення AI для розпізнавання образів - Обчислення - 2019

Anonim

Дослідницький підрозділ AI на Facebook відкритий для пошуку свого програмного забезпечення для розпізнавання зображень з метою просування технологій, так що він може бути застосований до реального відео. Facebook DeepMask, SharpMask та MultiPathNet тепер доступні всім користувачам GitHub.

Facebook раніше виклав свої системи розпізнавання образів в ряді дослідницьких робіт, які також доступні для громадськості разом із його демонстрацією. В даний час алгоритми компанії працюють у поєднанні зі своєю MultiPathNet свертональні нейронними мережами - AI, який подає величезну кількість даних, поки не може самостійно розпізнавати інші дані - дозволяючи Facebook зрозуміти зображення на основі кожного пікселя, який він містить.

Щоб класифікувати та позначити об'єкти на зображенні, Facebook об'єднує свою структуру сегментації DeepMask з модулем уточнення сегмента SharpMask. Останній етап роботи системи машинного бачення системи Facebook використовує AI для глибокого вивчення MultiPathNet для позначення кожного об'єкта на фотографії.

Відповідно до Facebook, програмне забезпечення для автоматичного бачення AI просунулося в стрибках упродовж останніх декількох років, дозволяючи типову класифікацію зображень, яка ще не існувала незадовго. Facebook стверджує, що відкрите джерело програмного забезпечення має вирішальне значення для його просування.

Приклади зображень відскановані повною системою розпізнавання зображень у Facebook

Глибокі методи навчання виховуються по всьому великому синьому бегемоту. AI впроваджує функцію розпізнавання обличчя Facebook (суперечливу), керує корекцією у своєму каналі новин і навіть використовується в рамках свого цифрового помічника для програми Messenger.

Це не перший раз, коли Facebook відкрив джерело свого ІІ. Фактично, компанія є дещо з переслідувача, коли мова йде про обмін своїми технологіями. У грудні Facebook представив свій найсучасніший комп'ютерний сервер, присвячений AI, до Open Compute Project - групу, що складається з технічних гігантів, таких як Apple та Microsoft, які поділяють проекти своєї комп'ютерної інфраструктури.

Facebook вже передбачає майбутні випадки використання технології розпізнавання образів. Компанія виявляє, що це потенційно може допомогти йому будувати на основі існуючих ідентифікаційних характеристик зображень для людей з вадами зору.

"В даний час користувачі з вадами зору, які переглядають фотографії на Facebook, чують лише ім'я особи, яка поділилася фотографією, а потім термін" фото ", коли вони потрапляють на зображення в своєму каналі новин", пише Піотр Долар, дослідник у Facebook AI Research (FAIR), в блозі. "Натомість ми прагнемо запропонувати багатші описи, такі як" Фото містить пляж, дерева та три посміхнені люди "."

Крім того, Facebook стверджує, що його наступним завданням є застосування його технологій розпізнавання образів до відео, "де об'єкти рухаються, взаємодіють і змінюються з плином часу", і навіть Facebook Live трансляції. "Класифікація в режимі реального часу може допомогти повернути релевантні та важливі живі відео на Facebook, одночасно застосовуючи більш вишукані методи виявлення сцен, об'єктів та дій у просторі та часі, може коли-небудь дозволити розповідь у режимі реального часу", додає Долар.