Investigadores de la Pompeu Fabra observan que Google Scholar invisibiliza los documentos que no están en inglés

Foto de Negocios creado por katemangostar - www.freepik.es

Los investigadores de la Universidad Pompeu Fabra (UPF) Cristòfol RoviraLluís Codina Carlos Lopezosa, miembros del Departamento de Comunicación, han observado que Google Scholar invisibiliza los contenidos científicos que no se redactan y difunden en inglés.

Estos docentes han comprobado que la visibilidad de los artículos científicos, ponencias o comunicaciones a congresos está condicionada a que sean encontrados fácilmente en los buscadores académicos, especialmente en Google Scholar. Para ello, en los últimos años se está aplicando la optimización de los motores de búsqueda o SEO en los buscadores académicos (ASEO) con la finalidad de optimizar los documentos para que aparezcan antes en los listados de resultados.

Una investigación reciente, publicada en Future Internet, ha determinado que el idioma del documento es un factor que interviene en el algoritmo de ordenación de los resultados de las búsquedas en Google Scholar.

«Para llevar a cabo esta optimización es necesario avanzar en el conocimiento del algoritmo de ordenación por relevancia de Google Scholar para luego, a partir de este conocimiento, hacer más evidentes las características que ya tienen los documentos y que encajan con los criterios de ordenación», afirma Rovira, primer autor del estudio. Google Scholar no explica cómo es este algoritmo para evitar prácticas fraudulentas y por tanto este tipo de investigaciones son necesarias.

Para el estudio, los autores han aplicado una metodología de investigación de ingeniería inversa basada en el análisis estadístico con el coeficiente de correlación de Spearman. Se ha analizado una muestra de 45 búsquedas de 1.000 resultados (45.000 documentos) de tres tipos: por autor, por palabras clave y por años.

Se discriminan artículos de calidad con cientos de citas

Los resultados obtenidos, publicados también en la web de la UPF, indican que cuando se hace una búsqueda en Google Scholar con resultados en diversos idiomas, la inmensa mayoría (90%) de los documentos en idiomas diferentes al inglés quedan sistemáticamente relegados a posiciones que los hacen totalmente invisibles.

Estos documentos ocupan casi siempre posiciones por encima de la 900 aunque sean artículos de calidad que hayan recibido cientos de citas. Por tanto, se puede afirmar que Google Scholar discrimina los documentos que no son en lengua inglesa en búsquedas con resultados multilingües.

La ignorancia de este factor puede estar perjudicando a investigadores de todo el mundo de habla no inglesa, ya que pueden creer que no existen artículos en su lengua materna al llevar a cabo búsquedas con resultados multilingües, sostienen los autores de la investigación.

«Esto es así singularmente en las búsquedas por año, las búsquedas con resultados multilingües más frecuentes. No obstante, también ocurrirá con algunas palabras clave que se usan de la misma forma en todo el mundo, como por ejemplo marcas comerciales, compuestos químicos, productos industriales, siglas, medicamentos, enfermedades, covid, sin ir más lejos», comentan los autores del estudio.

Y añaden que, «por otra parte, a la luz de los resultados, desde un punto de vista enfocado al ASEO, resultará evidente que mientras no se solucione este sesgo, las posibilidades de posicionarse en Google Scholar en las búsquedas multilingües aumentan de manera extrema si se publica en inglés».

Gráfica de los resultados del estudio

Este gráfico de dispersión resume los resultados de la investigación. Hay 45.000 puntos, uno por documento. Los puntos grises representan los documentos escritos en inglés, los rojos en otras lenguas y los azules son las medianas de las posiciones.

El gráfico muestra cómo los artículos escritos en lenguas que no son el inglés aparecen por encima de la posición 900 en el ranking de Google Scholar. Esto es así aunque sean documentos de calidad, tengan cientos de citas recibidas y en el ranking por número de citas ocupen buenas posiciones.

Los casos más llamativos son los puntos rojos situados en el extremo inferior derecho. Corresponden a documentos escritos en lenguas distintas al inglés que tienen un ranking por el número de citas inferior a 100 y un ranking de Google Scholar superior a 900. Esto significa que todos ellos reciben más de mil citas y aparecen en Google Scholar en las mismas posiciones que documentos en inglés con solo decenas de citas.

Éxito Educativo
Author: Éxito Educativo

Redacción de Éxito Educativo, información sobre la actualidad educativa, especialmente toda la relacionada con la gestión lo centros.

Dejar respuesta

Please enter your comment!
Please enter your name here