Meta представила и запустила новые инструменты компьютерного зрения, которые можно использовать для идентификации объектов на изображении , сообщает payspacemagazine.com.
Эти инструменты включают новую модель Segment Anything (SAM) и набор масок Segment Anything объемом 1 миллиард единиц (SA-1B). Соответствующая информация содержится в публикации, которая была размещена в блоге компании в минувшую среду, 5 апреля.
Названия инструментов были составлены на основе сегментации — процесса определения принадлежности пикселей изображения к конкретному объекту.
Доступ к SAM предоставляется по разрешительной открытой лицензии. SA-1B доступен для исследовательских целей.
SAM имеет общее представление о том, что такое объекты. Это означает, что данный инструмент может идентифицировать те объекты материального мира, которые ранее не попадали в его поле зрения. Для ЗАМ характерно обобщенно-абстрактное осознание самого понятия объекта. Такой уровень понимания окружающей объективной реальности обеспечивает широкий спектр вариантов использования. Прибор не требует дополнительной подготовки для работы в ранее незнакомых условиях, например, в клеточной микроскопии или подводном космосе.
В публикации, размещенной в блоге компании, отмечается, что эту модель можно использовать, чтобы помочь крупным системам искусственного интеллекта получить более объемное и масштабное представление о мире. Эта технология также предоставит создателям контента возможность извлекать части изображения при создании коллажей или редактировании видео. Использование инструментов для научных исследователей заключается в том, что их можно использовать для изучения и отслеживания животных или объектов неживотного происхождения.
Набор данных SA-1B включает 1,1 миллиарда масок, которые охватывают различные регионы, уровни материального и финансового благополучия, а также демографическую информацию.
SAM имеет одинаковый уровень эффективности вне зависимости от социальной группы, в которой он используется, и сложности ситуации.
Meta ожидает, что ее инструменты ускорят исследования в области сегментации и более общего понимания изображений и видео.
Компьютерное зрение, являющееся одной из областей искусственного интеллекта, используется компаниями по-разному. Например, компания Pensa, занимающаяся технологиями розничной торговли, использовала компьютерное зрение и искусственный интеллект для сканирования полок.
Google использует компьютерное зрение, искусственный интеллект и миллиарды изображений для создания высокоточных изображений местности, представленных в виде иммерсивного представления на картах.
Источник payspacemagazine.com