Deja vu: A study of scientific publication ethics
Álvaro Roldán López5 February 2008
Es posible que ya hayáis leido la entrada eTBLAST, el buscador contra el plagio, ha identificado ya 70.000 duplicados sólo en Medline de Documenea, que hayáis leido A tale of two citations en Nature, o que hayáis leido hoy La trampa de los estudios repetidos en el Servicio NotiWEB de madri+d. El caso es que aunque algo había leido sobre eTBLAST: A text similarity-based engine for searching literature collections, no le había prestado la atención debida. En uno de los proyectos que tienen en marcha este equipo de investigadores de la Universidad de Texas, llamado Deja vu: A study of scientific publication ethics, han lanzado eTBLAST contra Medline y han recogido 71312 pares de registros sospechosamente similares. Si observamos un registro completo de duplicados (os pongo un ejemplo español), podemos observar que hay una clara similitud entre los dos artículos emparejados. Además de este proyecto, han desarrollado otros que me parecen especialmente interesantes como son FRISC: The Faculty Research Interests Science Comparator y RIC: Research Interest Comparator, dos proyectos muy similares entre sí y que permiten localizar información relevante para investigadores biomédicos y ARGH: Biomedical Acronym Resolver, que permite obtener definiciones de acrónimos localizados en Medline. Las posibilidades que ofrece la minería de datos en combinación con la publicación electrónica son tremendas. Por el momento Deja vu seguro que nos dará mucho juego los próximos meses.


[...] de datos Deja Vu: a Database of Highly Similar and Duplicate Citations de la que ya os hablé en Deja vu: A study of scientific publication ethics. El correo en cuestión (sospecho que está montado de manera automatizada) adjunta los dos [...]
Autor: Bibliometria » Blog Archive » A few questions about a couple publications