Spam científico generado con SCIgen en conferencias de Springer e IEEE

Por Francisco R. Villatoro, el 25 febrero, 2014. Categoría(s): Bibliometría • Ciencia • Nature • Noticias • Science ✎ 3

left to right: Dan Aguayo, Max Krohn, Jeremy Stribling

Todo el mundo sabe que hay conferencias científicas con revisión por pares que aceptan artículos generados por ordenador. Mucha gente cree que el problema es pequeño. Pero no lo es. Springer e IEEE han eliminado de su web más de 120 artículos científicos publicados en los libros de actas de conferencias con revisión por pares. Todos fueron generados por ordenador. La mayoría tienen autores chinos y han sido publicados en conferencias organizadas en China. Nos lo cuenta Richard Van Noorden, «Publishers withdraw more than 120 gibberish papers,» Nature News, 24 Feb 2014.

Dibujo140225 duplicate and fake publications in the scientific literature - scientometrics - springer

El informático Cyril Labbé, de la Universidad Joseph Fourier en Grenoble, Francia, ha desarrollado un algoritmo para detectar manuscritos escritos de forma automática por el software SCIgen (inventado en 2005 por Dan Aguayo, Max Krohn y Jeremy Stribling, en la foto delante del CSAIL del MIT, Instituto Técnico de Massachusetts, en Cambridge). Su artículo es Cyril Labbé, Dominique Labbé, «Duplicate and fake publications in the scientific literature: how many SCIgen papers in computer science?,» Scientometrics 94: 379-396, Jan 2013.

No está claro cuántas personas han usado SCIgen, ni con qué fines, pero Labbé ha identificado 120 artículos publicados en conferencias de Springer e IEEE. Ha informado de ello a estas editoriales, que han retractado (eliminado de su web) dichos artículos; aunque sin ofrecer ninguna explicación. Artículos que fueron aceptados en conferencias que afirman tener una rigurosa revisión por pares. Muchos revisores rechazan artículos dudosos en conferencias con la frase: «I do not recommend to accept this paper if the paper quota of the conference is quite limited.»

Dibujo20140225 spam

¿Por qué los editores/organizadores de conferencias no evitan el problema? Detectar el fraude es fácil, basta aplicar el software de Labbé, o uno equivalente, a todos los manuscritos aceptados. Más aún, Labbé no ha realizado una búsqueda en profundidad, limitándose a las conferencias de Springer e IEEE a las que ha tenido acceso. Quizás los 120 artículos que ha detectado son sólo la punta del alfiler.

Nature ha contactado con Springer e IEEE para recabar su opinión. Springer dice que tomará medidas: se ha puesto en contacto con los editores de los libros de actas y con los autores de los artículos retirados para solicitar una explicación. IEEE no ha dicho nada concreto: seguirán aplicando los más altos estándares en sus conferencias. 

Spam en el corazón de la ciencia. 



3 Comentarios

  1. Por ahora parecía que SciGen había superado el test de Turing 😀

    Desafortunadamente, no creo que pase mucho tiempo hasta que aparezca una versión de SciGen que tenga un patrón menos detectable para que este tipo de articulos generados automáticamente se vuelva a colar en conferencias «timo» y predatory publishers.
    A veces da la impresión de que es suficiente con que un grupo de investigación tenga dinero (público o no) y pocos escrúpulos para engordar el CV de sus investigadores. :-C

  2. Pero esto no son predatory publishers. Son springer y el IEEE.

    Este podría ser el grupo control del estudio de Bohannon en Science. A las editoriales tradicionales también se la cuelan.

    Aunque hay que reconocer que se trata de congresos, y ahí cada comunicación aceptada es luego una inscripción. De algo hay que vivir

  3. «Springer dice que tomará medidas: se ha puesto en contacto con los editores de los libros de actas y con los autores de los artículos retirados para solicitar una explicación.»

    Qué risa. Si la experiencia que yo conozco es representativa, las actas de congresos que publica Springer le llegan totalmente hechas y a coste 0: se le pasan instrucciones a algún pringado de la organización sobre como tiene que hacer el typesetting de todo el libro -que es donde estaría el coste, ya que por supuesto tampoco se hace ninguna corrección de textos, más allá de la que haga esa persona pringada p.ej. repasando que las referencias estén al gusto de la editorial- y Springer lo único que hace es poner la hoja con el copyright y los datos para la Biblioteca del Congreso, y la portada con el caballito.

    El dinero que Springer cobra al congreso es simplemente alucinante, y luego vende fuera del congreso el volumen sin tener ningún derecho legal a ello, por precios igualmente alucinantes (por ejemplo, 342 euros por un libro de actas de 630 páginas). Insisto, careciendo de derecho legal a venderlo, ni en papel ni online, puesto que los autores no firman ninguna autorización ni cesión de copyright para ello.

    Luego resulta que lo que va dentro lo ha escrito SCIgen, y todavía se atreven a hacerse los ofendidos.

Deja un comentario