El buscador de Google lee ahora imagenes

Texto en archivos gráficos y PDF


[ 05/11/2008 - 08:41 CET ]

Google ha incorporado una nueva función a su buscador, que le permite
leer texto en imágenes. Esto permite, entre otras cosas, encontrar
documentos escaneados y texto en formato PDF.

Google ha dado un nuevo
paso hacia su objetivo de poner toda la información del mundo a
disposición de los usuarios de Internet.

En efecto, el buscador ha mejorado
considerablemente su función de reconocimiento de imágenes. Los
documentos digitalizados y guardados como archivos gráficos aparecerán
con mucha mayor frecuencia en los resultados de búsquedas. , y lo mismo
ocurrirá con los archivos PDF.

"Anteriormente, los documentos
digitalizados rara vez aparecían en la lista de resultados", escribe
Evin Levey, gerente de producto en Google, en el blog oficial de la
compañía.

"Ocasionalmente había elementos en el documento, que
nos permitía indexarlo. Por ejemplo, el nombre del documento. La
diferencia es que ahora podremos buscar directamente en todos los
archivos PDF. Nuestra función de reconocimiento óptico de caracteres
cambia las imágenes en palabras, que son indexadas en el buscador",
indica Levey.

La nueva técnica tendrá gran relevancia para el
periodismo investigativo y la ciencia, especialmente considerando que
las autoridades y los científicos tienen una cierta tendencia a
digitalizar documentos.

Fuente Diario Ti