Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra

Turnitin y PlagScan: así funcionan los programas antiplagio que ha usado La Moncloa

El 'software' de pago permite cotejar un documento con millones de textos científicos y de la web para detectar posibles copias

FOTO: Presentación del programa de detección de plagios PlagScan. / VÍDEO: Declaraciones de Lluis Val, responsable en España del programa Turnitin

La Moncloa ha sometido la tesis doctoral de Pedro Sánchez a la evaluación de dos herramientas informáticas que comparan el texto con millones de documentos, académicos o no. El primero de los programas, Turnitin, ha determinado que un 13% del texto aparece en otros documentos. El segundo, PlagScan, otro mucho más bajo: un 0,96%. Las diferencias derivan de las metodologías, afirma la nota de prensa de Presidencia del Gobierno. Desde la empresa alemana PlagScan, su director, Markus Goldbach, asegura que esa cifra significa que Sánchez "no usó muchos fragmentos de otros textos en él". Goldbach afirma que La Moncloa no se ha puesto en contacto con la empresa para realizar el análisis. "Es posible que hayan utilizado alguno de los acuerdos con compañías o universidades españolas", asevera. 

¿Cómo funcionan estos programas? En el caso de Turnitin, los usuarios cargan en la herramienta los documentos que quieren cotejar. A veces la solución está integrada en las plataformas virtuales en las que los alumnos suben sus trabajos, como Moodle o Blackboard. Esos soportes analizan directamente los documentos antes de pasárselos al profesor. Un docente de la Universidad Complutense de Madrid, que prefiere que no se publique su nombre, asegura que en su facultad los alumnos cuelgan sus trabajos en un sistema que lo controla directamente. “A los profesores nos mandan e-mails diciendo que los trabajos de final de grado y de máster pasan por esas herramientas. Si se encuentra algo, se informa al profesor”, añade. Una portavoz de este centro añade que se analizan automáticamente los trabajos y las tesis doctorales, y que se hace por defecto, en cuanto el alumno sube su texto al aula virtual.

¿Cómo se ven los resultados y qué significan los porcentajes de posible plagio? La herramienta busca las cadenas de texto y las comparan con los documentos de sus bases de datos. El usuario recibe como resultado el documento que ha comparado y, si hay coincidencia, se marcan en otro color los fragmentos que coinciden. El porcentaje final es el tanto por ciento de todo el texto que aparece en otro documento. 

¿A partir de qué porcentaje hay plagio? Depende del campo de estudio, afirma el director de PlagScan. "Un 20% de coincidencia en campos como el Derecho, donde es habitual citar literalmente fragmentos largos de jurisprudencia, no debe extrañar", afirma. Pero en campos como las ciencias naturales, por encima de un 3% "puede ser indicativo de posible copia". "Es difícil dar un porcentaje por encima del cual se pueda decir que no es aceptable", afirma un profesor universitario que ha usado Turnitin asiduamente y prefiere guardar anonimato. “[El porcentaje] es muy relativo. El programa te da un porcentaje global y porcentajes de cada sitio del que encuentra contenido. Puedes haber cogido el 10% de un sitio, el 15% de otro. Si te da una suma tremenda tienes un problema, pero también lo tendrías si de uno de esos textos has plagiado el 50% o más. Se valora teniendo en cuenta ambas cosas”, asegura. 

Pero también hay que tener en cuenta si las citas están bien atribuidas a las fuentes. Si se menciona correctamente a los autores, no cabría hablar de plagio. Una portavoz de la Universidad Complutense de Madrid explica que los informes de los trabajos llegan directamente al correo de los profesores, y que luego son estos los que, basándose en "su experiencia profesional y el sentido común" deciden qué parte de esa coincidencia detectada por el programa es plagio o simplemente una cita. "No hay establecida una norma general; se aplica según el criterio del profesor", añade.

¿Cuánto tarda el análisis? Muy poco. Un profesor universitario que ha usado Turnitin asiduamente y prefiere guardar anonimato califica la herramienta de "rapidísima" y "de resultado casi inmediato": "Es impresionante. Tarda segundos en analizar trabajos de 300 páginas”, asevera.

¿Cuánto cuesta usar estas herramientas y cuántas personas pueden acceder a ellas? PlagScan ofrece la posibilidad de pago por estudiante, con un coste aproximado de 1,5 euros por cabeza, o también por volumen de consulta: cotejar un millón de palabras tiene un precio de unos 250 euros. En el caso de Turnitin, el precio depende del número de usuarios a los que se brinda el acceso. Hasta 1.000, el precio anual de la herramienta es de 5.000 euros. Se trata de una tarifa plana, con precio fijo con independencia del número de consultas que se gestionen. La empresa gestiona también licencias que permiten el acceso a todos los usuarios de un campus. Esos acuerdos rondan los 100.000 euros anuales. La empresa no revela quién, entre sus clientes españoles, tiene contratada esa modalidad. 

¿Con quién tienen contrato en España? Turnitin trabaja con editoriales y universidades como la Complutense y la Autónoma de Madrid, la Politécnica de Valencia, Sevilla, Granada, Salamanca y Pompeu Fabra de Barcelona. 

¿Con qué documentos se comparan? Básicamente, los documentos cargados se comparan con tres tipos de fuentes en el caso de Turnitin: el material disponible en la web abierta (Wikipedia –Turnitin asegura que tiene indexado el 100% de la enciclopedia virtual–, El Rincón del Vago, National Geographic y los repositorios de tesis doctorales publicadas en abierto), los documentos académicos y científicos subidos a plataformas como Elsevier, Science, Epsco, Emeral o Proquest, y, finalmente, otros trabajos subidos por los estudiantes de las universidades que están suscritas a la herramienta. En este caso, aseguran fuentes de la empresa, esos documentos se suben a la base de datos solo si las universidades lo autorizan. En el caso de PlagScan se basan en cuatro pilares: la web (usan la herramienta de Microsoft de indexación, pero también una propia de la compañía), el total de todo lo que cargan los usuarios, si lo autorizan, y lo que han cargado otros clientes (también si lo autorizan), además de contenidos de editoriales científicas. Plagscan afirma contar con unas 30.000 publicaciones. La base de Turnitin se alimenta cada día con de 15.000 a 20.000 nuevos documentos, según fuentes de la empresa. 

¿Y si se plagia de otro idioma? Aquí las herramientas se topan con una dificultad enorme, aseguran desde PlagScan. "El problema no se ha solucionado todavía, y el cotejo no es perfecto en ningún idioma". El problema es que de un mismo texto fuente pueden hacerse muy diferentes traducciones. Una de las posibles soluciones para sortear este inconveniente está en comparar no solo cadenas literales de texto, sino también coincidencia de ideas, aunque no se expresen literalmente igual. 

¿Qué se puede escapar? Ninguna empresa cuenta con el 100% de acceso a la producción científica y académica. Además, no todos los contenidos están totalmente digitalizados o con sus textos en formato comparable. Desde PlagScan creen que se detecta el plagio en un 70% de las veces. El 30% restante se escapa. 

¿Qué otros aspectos, además de la coincidencia, alertan de un posible plagio? Los algoritmos de análisis valoran también la forma de expresarse de un autor (por ejemplo, las estructuras gramaticales más usuales que emplea). Si en un mismo texto un párrafo se sale de ese patrón, se alerta de posible plagio. Pero hay que recordar que la paráfrasis es habitual en los textos académicos, y no implica plagio. "¿Cuál es la diferencia entre una traducción y una paráfrasis? Es muy difícil de determinar", afirma Markus Goldbach. 

Más información