De la Facultad de Cs. Físicas y Matemáticas:

Investigadores de Ingeniería Industrial de la U. de Chile ganan "Mundial" de Detección de Plagio

U. de Chile: Investigadores ganan "Mundial" de Detección de Plagio
El equipo de DOCODE está compuesto por el Director prof. Juan Velásquez, junto con Sebastián Ríos, Director Alterno; Gastón L'Huillier, Jefe del proyecto; y Gabriel Oberreuter, investigador.
El equipo de DOCODE está compuesto por el Director prof. Juan Velásquez, junto con Sebastián Ríos, Director Alterno; Gastón L'Huillier, Jefe del proyecto; y Gabriel Oberreuter, investigador.
Académico de la U. de Chile, Juan Velásquez.
Académico de la U. de Chile, Juan Velásquez.

El académico de Ingeniería Industrial de la U. de Chile y Director del proyecto FONDEF DOcument Copy Detector (DOCODE), Juan Velásquez, se encuentra por estos días con una agenda muy ocupada. Dentro de las numerosas invitaciones recibidas ante él éxito del proyecto DOCODE, el profesor Velásquez se encuentra en estos momentos en Francia, donde debió dictar una conferencia este miércoles 24 en la Web Intelligence, reconocida como la reunión internacional más grande en su tipo.

Todo este reconocimiento se vio recientemente relevado luego que se diera a conocer el resultado de la competencia PAN (Uncovering Plagiarism, Authorship, and Social Software Misuse) donde el Director de DOCODE, profesor Velásquez, junto con Sebastián Ríos, Director Alterno; Gastón L'Huillier, Jefe del proyecto; y Gabriel Oberreuter, investigador del equipo, fueron reconocidos con el primer lugar a nivel mundial.

La iniciativa de este grupo de investigadores de la U. de Chile creó un software -disponible en versión 2.0- que detecta copia en los trabajos de los alumnos en materia de plagio intrínseco (sólo analizando el documento en cuestión) y plagio externo (comparando el documento sospechoso contra posibles fuentes), las dos categorías evaluadas en esta competencia.

UChile.online conversó con el profesor Juan Velásquez quien se dio un espacio para compartir con la comunidad la importancia del momento que están viviendo como equipo de investigadores.

 

Ganar la competencia demuestra que nuestro trabajo está a nivel mundial


-¿Cuál es la historia de esta competencia mundial y su importancia en el contexto internacional de su disciplina? ¿Qué países suelen liderar en estas materias a nivel mundial?

El tema de la detección de plagio desde documentos digitales diseminados en la Web debe tener unos 10 años, a lo sumo. Se trata de un área de investigación relativamente nueva motivada por los avances en TIC y la masificación de la Web.

En ese contexto la competencia no tiene más de 6 años y nace amparada en una conferencia relacionada con el procesamiento del lenguaje natural (NPL Natural Languaje Processing). Esta área es de las más antiguas en el ámbito de la ciencia de la computación.

La competencia PAN representa la instancia, a nivel mundial, donde se dan cita los investigadores que están trabajando en nuevas formas de detectar, vía algoritmos y sistemas computacionales complejos. Como grupo nos debemos inscribir y, si somos seleccionados, participamos en la competencia, la cual en síntesis consiste en que a todos los equipos se les entrega un grupo de documentos, en su mayoría originales, y otros que poseen distintos niveles de copia (párrafo, oraciones, documentos completos, etc.). Gana el que puede detectar con mayor precisión cuales documentos son copia y cuales no. Y dentro de estos, que parte son copia.

Por lo general esta competencia la habían ganado equipos de universidades europeas. Es la primera vez que la gana un equipo de America.


-¿Qué significa para su carrera académica y la de su equipo el haber obtenido el primer lugar en la Competencia PAN con su proyecto DOCODE y el reconocimiento del grupo de la Web Intelligence?

Para el proyecto DOCODe representa un enorme reconocimiento, por cuanto dentro de los objetivos considerados está lo de la comparación con otros sistemas. Ganar la competencia es la demostración más contundente que podemos presentar de que nuestros algoritmos son de primer nivel y a nivel mundial.

Como investigadores en Web Intelligence, ha significado un reconocimiento muy grande a nivel mundial, tanto así que hemos recibido muchas invitaciones a dar charlas en Europa y contar cómo desarrollamos a DOCODE. Sin ir mas lejos, estoy en estos momentos en la conferencia Web Intelligence en Francia, la más grande en su tipo, y esta tarde tendré mi intervención para mostrar nuestra impresión de para donde creemos se desarrollará la Web. Ahí hablaré de las bondades y los vicios, donde el tema del plagio ocupará parte de mi presentación.

Adicionalmente, la próxima semana estaré como keynote speaker en la IHCI 2011 Third International Conference on Intelligent Human Computer Interaction (http://arg.vsb.cz/IHCI2011/keynotes.aspx) contando la experiencia DOCODE.

Para la carrera académica en la U, digamos que es una distinción más entre otras que uno espera ganar. La U es muy exigente en esos temas.


-¿Cuáles serían las particularidades de su proyecto que lo hicieron acreedor del primer lugar?

Desarrollamos un algoritmo que detecta el plagio intrínseco, es decir, cuando en un documento existen variaciones de estilo en la escritura. Para ponerlo en forma simple, cada uno de nosotros tiene un estilo de escritura que es como su huella. Si en un documento intercalamos párrafos que no son del mismo autor, se produce una variación en el uso de conectores, verbos, etc. Esta variación nos indica un posible plagio a nivel de párrafo y nos da una información valiosa para calibrar la búsqueda de la fuente de plagio (en vez de buscar en toda la Web, solo vamos a algunos documentos)

-El desarrollo de este proyecto ha involucrado otras disciplinas, ¿qué valor le atribuye a la interdisciplinariedad en la investigación y el desarrollo de transferencia tecnológica?

El proyecto ha involucrado a colegas de la Facultad de Filosofía y Humanidades, lingüístas, psicólogos y sociólogos. También diseñadores y otros profesionales. Esto nos ha mostrado una tremenda oportunidad en el desarrollo de las TIC y su sinergia con otras áreas.

Mi principal reflexión es que si queremos hacer investigación de clase mundial, no podemos seguir encasillados a ser solo TIC. Es necesario armar equipos multidisciplinarios, ahí está la gran ventaja que podemos lograr frente a otros grupos de investigación. La multidisciplinariedad de DOCODE es lo que hace del proyecto una apuesta tan potente y es una de las variables que más llama la atención en nuestros pares en el mundo.

Como Universidad de Chile debemos buscar la forma de hacer interactuar a los grupos de investigadores de muchas disciplinas y esto, no creo que parta por dar incentivos económicos. Es mejor buscar la forma de "juntarnos" para compartir lo que hacemos y luego los grupos que se forman buscarán el financiamiento de alguna forma.


-A partir de la creación del DOCODE han recibido varias invitaciones para dictar conferencias en el extranjero, razón por la cual se encuentra ahora en Francia. Por favor cuéntenos sobre el encuentro que se está desarrollando en estos momentos en Europa y la recepción que ha tenido por parte de sus colegas.

En Francia estoy en la Web Intelligence Conference. Ahí presentaré dos trabajos, uno relacionado con DOCODE. También expondré nuestra visión del desarrollo futuro de la web en un panel internacional donde están los expertos mundiales del área. El sólo hecho que te inviten a compartir tu impresión en ese panel es de por si un honor y un tremendo reconocimiento internacional. No siempre tienes la oportunidad de influir en decisiones tan trascendentales como hacia donde enfocar la investigación de toda una comunidad científica.

Luego viene la conferencia de Praga (de la que hablé arriba) donde estaré como keynote speaker, nuevamente un reconocimiento tremendo a la labor desarrollada en DOCODE. Continuamos con Romanía donde dictaré una charla en la University of Cluj y tendré la oportunidad de compartir con varios investigadores del área, para continuar en Austria, donde mostraré en la conferencia I-Know sobre innovación en TIC, el modelo de negocio creado para DOCODE.

Mi periplo continúa en Alemania, en la conferencia KES2011 donde mostraremos parte de los algoritmos que se construyeron en DOCODE para finalizar el viaje en Holanda, donde recibiremos el premio de la competencia PAN.

También recibí una invitación para ser profesor visitante de la VSB-Technical University of Ostrava, Czech Republic, nuevamente por DOCOE.


-¿Qué le diría a las nuevas generaciones que están interesados en su disciplina respecto a los campos de desarrollo que abre la investigación?

Lo primero, que confíen en sí mismos, en que se puede hacer investigación de clase mundial desde Chile. La invitación es a "creerse el cuento", por cuanto muchas veces pensamos que todo viene desde el primer mundo y que nosotros solo debemos ser expertos en conectar cajas negras. El éxito de DOCODE, radica esencialmente en el talento de los alumnos que ahí han trabajado, nuestros alumnos de la U que son lejos los mejores de Chile y ahora demuestran que se pueden parar de tú a tú en el mundo.

Ahora también les digo, no teman al "chaqueteo" de nuestro país, que es parte casi de nuestro himno nacional. Cuando tengan una idea novedosa, no se dejen intimidar por los clásicos pesimistas que encuentran todo malo, oídos sordos nada más y seguir adelante. Si les contara las de veces que me dijeron que DOCODE era una mala idea, no me creerían.

Buscar nichos de mercado es buscar necesidades no cubiertas. Piensen en simple, hay muchas posibilidades que se pueden cubrir y la tecnología puede ser un buen aliado.


-Finalmente, ¿de qué manera le ha ayudado ser miembro de la Universidad de Chile en esta carrera que ha emprendido en su disciplina?

Lo primero, estar en un lugar donde las ideas -por muy extrañas que puedan ser- tienen al menos una instancia de ser escuchadas y apoyadas. Segundo, contar con una red de investigadores de excelencia con quienes puedes enfocar un trabajo. Y tercero, y lo más importante de todo, los alumnos de la U. ¡Con sus talentos y calidad humana podemos llegar hasta donde queramos!