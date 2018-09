Moncloa ha sometido la tesis doctoral de Sánchez a la evaluación de dos herramientas informáticas que comparan el texto con millones de documentos, académicos o no. El primero de los programas, Turnitin, ha determinado que un 13% del texto aparece en otros documentos. El segundo, PlagScan, otro mucho más bajo: un 0,96%. Las diferencias derivan de las metodologías, afirma la nota de prensa de Presidencia del Gobierno. Desde la empresa PlagScan, su director, Markus Goldbaech, asegura que esa cifra significa que Sánchez "no usó mucho fragmentos de otros textos en él". Goldbach afirma que La Moncloa no se ha puesto en contacto con la empresa para realizar el análisis. "Es posible que hayan utilizado alguno de los acuerdos con compañías o universidades españolas", asevera.

¿Cómo funcionan estos programas? En el caso de Turnitin, los usuarios cargan en la herramienta los documentos que quieren cotejar. En algunos casos, la solución está integrada en las plataformas virtuales en las que los alumnos cargan sus trabajos, como Moodle o Blackboard. Esos soportes analizan directamente los documentos antes de pasárselos al profesor. Un docente de la Universidad Complutense de Madrid, que prefiere que no se publique su nombre, asegura que en su facultad los alumnos cuelgan sus trabajos en un sistema que lo controla directamente. “A los profesores nos mandan e-mails diciendo que los trabajos de final de grado y de máster pasan por esas herramientas. Si se encuentra algo, se informa al profesor”, añade.

¿Cómo se ven los resultados y qué significan los porcentajes de posible plagio? La herramienta busca las cadenas de texto y las comparan con los documentos de sus bases de datos. El usuario recibe como resultado el documento que ha comparado y, si hay coincidencia, se marcan en otro color los fragmentos que coinciden. El porcentaje final es el tanto por ciento de todo el texto que aparece en otro documento.

¿A partir de qué porcentaje hay plagio? Depende del campo de estudio, afirma el director gerente de PlagScan, Markus Goldbaech. "Un 20% de coincidencia en campos como el derecho, donde es habitual citar literalmente fragmentos largos de jurisprudencia, no debe extrañar". Pero en campos como las ciencias naturales, por encima de un 3% "puede ser indicativo de posible copia". "Es difícil dar un porcentaje", afirma un profesor universitario que ha usado Turnitin asiduamente y prefiere guardar anonimato. “[El porcentaje] es muy relativo. El programa te da un porcentaje global y porcentajes de cada sitio del que encuentra contenido. Puedes haber cogido el 10% de un sitio, el 15% de otro. Si te da una suma tremenda tienes un problema, pero también lo tendrías si de uno de esos textos has plagiado el 50% o más. Se valora teniendo en cuenta ambas cosas”, asegura.

¿Cuánto tarda el análisis? Muy poco. Un profesor universitario que ha usado Turnitin asiduamente y prefiere guardar anonimato califica la herramienta de "rapidísima" y "de resultado casi inmediato": "Es impresionante. Tarda segundos en analizar trabajos de 300 páginas”, asevera.

¿Cuánto cuesta y cuántas personas pueden acceder a las herramientas? PlagScan ofrece la posibilidad de pago por estudiante, con un coste aproximado de 1,5 euros por cabeza, o también por volumen de consulta: cotejar un millón de palabras tiene un precio de unos 250 euros. En el caso de Turnitin, el precio depende del número de usuarios a los que se brinda el acceso. Hasta 1.000, el precio anual de la herramienta es de 5.000 euros. Se trata de una tarifa plana, con precio fijo con independencia del número de consultas que se gestionen. La empresa gestiona también licencias que permiten el acceso a todos los usuarios de un campus. Esos acuerdos rondan los 100.000 euros anuales. La empresa no revela quién, entre sus clientes españoles, tienen contratada esa modalidad.

¿Con quién tienen contrato en España? Turnitin trabaja con editoriales y universidades como la Complutense y la Autónoma de Madrid, la Politécnica de Valencia, Sevilla, Granada, Salamanca y Pompeu Fabra de Barcelona.

¿Con qué documentos se comparan? Básicamente, los documentos cargados se comparan con tres tipos de fuentes en el caso de Turnitin: el material disponible en la web abierta (Wikipedia -Turnitin asegura que tienen indexada el 100% de la enciclopedia virtual-, El Rincón del Vago, National Geographic y los repositorios de tesis doctorales publicadas en abierto), los documentos académicos y científicos subidos a plataformas como Elsevier, Science, Epsco, Emeral o Proquest, y, finalmente, otros trabajos subidos por los estudiantes de las universidades que están suscritas a la herramienta. En este caso, aseguran fuentes de la empresa, esos documentos se suben a la base de datos solo si las universidades lo autorizan. En el caso de PlagScan se basan en cuatro pilares: la web (usan la herramienta de Microsoft de indexación, pero también una propia de la compañía), el total de todo lo que cargan los usuarios, si lo autorizan, y lo que han cargado otros clientes (también si lo autorizan), además de contenidos de editoriales científicas. Plagscan afirma contar con unas 30.000 publicaciones. La base de Turnitin se alimenta cada día con de 15.000 a 20.000 nuevos documentos, según fuentes de la empresa.

¿Y si se plagia de otro idioma? Aquí las herramientas se topan con una dificultad enorme, aseguran desde PlagScan. "El problema no se ha solucionado todavía, y el cotejo no es perfecto en ningún idioma". El problema es que de un mismo texto fuente pueden hacerse muy diferentes traducciones. Una de las posibles soluciones para sortear este inconveniente está en comparar no solo cadenas literales de texto, sino también coincidencia de ideas, aunque no se expresen literalmente igual.

¿Qué se puede escapar? Ninguna empresa cuenta con el 100% de acceso a la producción científica y académica. Además, no todos los contenidos están totalmente digitalizados o con sus textos en formato comparable. Desde PlagScan creen que se detecta el plagio en un 70% de las veces. El 30% restante se escapa.

¿Qué otros aspectos, además de la coincidencia, alertan de un posible plagio? Los algoritmos de análisis valoran también la forma de expresarse de un autor (por ejemplo, las estructuras gramaticales más usuales que emplea). Si en un mismo texto un párrafo se sale de ese patrón, se alerta de posible plagio. Pero hay que recordar que la paráfrasis es habitual en los textos académicos, y no implica plagio. "¿Cuál es la diferencia entre una traducción y una paráfrasis? Es muy difícil de determinar", se pregunta Markus Goldbaech.