En el mundo de la ciencia hay competiciones de todo tipo, y ya he mencionado en este blog algunas de las existentes en bioinformática. Pero una que por suerte o por desgracia acaba de surgir es una competición relacionda con minería de textos científicos enfocada en la detección de plagios:
SEPLN'09 Workshop PAN. Uncovering Plagiarism, Authorship and Social Software Misuse.
Los dos objetivos de esta competición son el análisis del plagio tanto externo como intrínseco:
- El análisis del plagio externo toma como base un conjunto de documentos sospechosos y un conjunto de documentos originales, y consiste en identificar qué partes de los documentos originales han sido plagiadas en los documentos sospechosos.
- El análisis del plagio intrínseco es más sutil (y a la vez, más difícil), porque toma como base sólamente un conjunto de documentos sospechosos, sin poder tomar información externa de otros documentos, y hay que identificar aquellos pasajes plagiados, por ejemplo detectando los cambios bruscos en el estilo literario.
Será interesante ver qué resultados, software y conclusiones surgen de esta competición.