Amazon запускает облачный сервис для документов

Вaм нужнo быстрo и aвтoмaтичeски инфoрмaцию из рaзличныx дoкумeнтoв извлeчь? И вы, крoмe тoгo, быть в видe скaнoв или фoтoгрaфии? Вaм пoвeзлo, eсли вы клиeнт Amazon Web Services (AWS). Amazon oбъявилa oб oткрытии дoступa к Textract, oблaчныx и полностью управляемый сервис, который использует машинное обучение для анализа таблиц, текстовых форм, и весь текст страницы в популярных электронных форматах. До сих пор он будет только в некоторых регионах AWS, особенно в Восточной части США (штат Огайо и Северная Вирджиния), на западе США (штат Орегон) и ЕС (Ирландия), и в следующем году Textract доступна для всех желающих.
Textract — новый сервис AWS распознать с которыми клиенты Amazon и эффективно систематизировать сбор документов.

Как Amazon утверждает, Textract значительно эффективнее, чем традиционные оптические системы распознавания символов. Из файлов в корзине Amazon S3, он может извлекать содержимое полей таблиц и принимая во внимание контекст, в котором эта информация будет представлена, к примеру, система автоматически выбирает имена и номера социального страхования в налоговой-бланки и общие итоги после сфотографировать квитанцию. Как отмечает в пресс-релизе Amazon, Textract поддерживает такие форматы изображений, такие как сканирования, PDF-файлы и фотографии, а также эффективно работает с контекстом в конкретных документах для финансовых услуг, страхования и здравоохранения.

Textract сохраняет результаты в формате JSON, с аннотациями со страницы разделов, метки формы и типы данных числа, и, при желании, интегрировать с сервисами баз данных и аналитики, такие как Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Афина и продукты машинного обучения, Comprehend, таких как Amazon, Amazon Comprehend Medical, Amazon и Amazon Translate Maker Говорю, для постобработки. В качестве альтернативы извлеченные данные могут быть переданы непосредственно в облачные сервисы сторонних организаций с целью обеспечения соответствия в области бухгалтерского учета и аудита или для поддержки интеллектуальный поиск в архивах документов. Как Amazon утверждает, Textract часов может «точно» обрабатывать миллионы страниц всевозможных документов «только некоторые».

Многие AWS клиенты уже используют Textract, включая Globe and Mail, National погоды данные службы Великобритании, PricewaterhouseCoopers, некоммерческая организация здравоохранения Health First общества и управляемых по автоматизации роботизированных процессов UiPath, и Ripcord Blue Prism. Candor, Start-up, целью которого является принести прозрачность в ипотечный кредит промышленности, использует Textract, чтобы получить данные из таких документов как выписки из банковских счетов, платежные квитанции и различные налоговые документы, чтобы ускорить процесс одобрения кредита для своих клиентов.

«Amazon делает Textract заключается в том, что он именно текстовых и структурированных данных из практически любой документ извлечен без необходимости предварительного машинного обучения», — говорит вице-президент Amazon Machine Learning Свами Захватчиков (Свами Sivasubramanian). «Кроме интеграции с другими сервисами AWS, расположенными большое сообщество, какие Textract вокруг Amazon, позволяет нашим клиентам получить реальные выгоды от своих коллекций файлов, работать более эффективно, повысить соответствие требованиям безопасности, автоматизации ввода данных и ускорить принятие бизнес-решений».

Ниже вы можете повторно презентацию Textract на конференции:Invent 2018 на английском языке.

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.