Den Angaben von Adobe zufolge zirkulieren derzeit rund 2,5 Billionen PDF-Dateien in der Welt. Sie enthalten Unmengen an wissenschaftlichen und technischen Inhalten sowie andere wichtige Informationen. Allerdings befinden sich all diese Inhalte „in der Finsternis“, wie IBM in einer Medienmitteilung schreibt. Forscher von IBM Research in Rüschlikon haben nun eine Technologie entwickelt, mit der Inhalte aus diesen Daten rasch gesucht und extrahiert werden können.
Ihre Technologie Corpus Conversion Service ermöglicht es, 100.000 PDF-Dateien pro Tag zu bearbeiten. Danke Künstlicher Intelligenz werden Inhalte wie Texte, Tabellen und Grafiken erkennbar gemacht. So können gesuchte Informationen in einer riesigen Menge an PDF-Dateien rasch verfügbar gemacht werden.
Der Corpus Conversion Service wird derzeit von mehreren externen Partnern von IBM getestet. Zu ihnen gehören etwa Versicherer, welche die Technologie nutzen, um unstrukturierte Anträge zu bearbeiten. Die Entwicklung wird aber auch von Unternehmen aus anderen Branchen wie etwa Chemie, Öl und Gas oder der Unterhaltungselektronik getestet. Bis Ende Jahr soll die Lösung offiziell lanciert werden. Sie wurde auch an der ACM Conference on Knowledge Discovery and Data Mining (KDD 2018) vom 19. bis zum 23. August in London vorgestellt.
IBM Research in Rüschlikon ist eines der zwölf Forschungseinrichtungen von IBM weltweit. Es besteht seit 1956. ssp
Weitere News
Kontaktieren Sie uns
Unsere Services sind kostenlos und beinhalten:
- Vermittlung von Schlüsselkontakten in Industrie, Wissenschaft und Verwaltung
- Beratung zu rechtlichen Rahmenbedingungen, Steuern, Arbeit, Markt und Unternehmensgründung
- Massgeschneiderte Besichtigungen, einschließlich Büro- und Co-Working-Space