Revista Integración, temas de matemáticas.
Vol. 23 Núm. 1 (2005): Revista Integración, temas de matemáticas
Artículo Original

Modelos clásicos de recuperación de la información

Luis Gabriel Jaimes
Universidad de Puerto Rico en Humacao
Biografía
Fernando Vega Riveros
Universidad de Puerto Rico en Mayagüez
Biografía

Publicado 2005-02-17

Palabras clave

  • information Retrieval,
  • text mining,
  • data mining o data discovery

Cómo citar

Jaimes, L. G., & Vega Riveros, F. (2005). Modelos clásicos de recuperación de la información. Revista Integración, Temas De matemáticas, 23(1), 17–26. Recuperado a partir de https://revistas.uis.edu.co/index.php/revistaintegracion/article/view/479

Resumen

La recuperación de la información (RI, Information Retrieval en inglés) es una rama de la computación que se ocupa, como su nombre lo indica, de extraer información de documentos no estructurados (cartas, periódicos, artículos, etc.) de los cuales, a diferencia de los datos con estructura (almacenados en bases de datos) no es fácil sacar información útil automáticamente. Estas técnicas son parte de una rama más amplia de la computación, conocida como minería de textos (text mining), que puede ser vista como un caso particular de "minería de datos" (Data Mining o Data Discovery). Actualmente estas técnicas son ampliamente usadas en buscadores de Internet como Google, Yahoo, etc. En este trabajo se revisaron 3 modelos clásicos: booleano, vectorial y probabilístico. Estos tres modelos usan una simplificación que solo tiene en cuenta el aspecto léxico, pero no la semántica del documento. 

 

Descargas

Los datos de descargas todavía no están disponibles.

Referencias

[1]R. Baeza-YatesandB. Ribeiro-Neto.Modern Information Retrieval,Addison-Wesley, Wokingham, UK, 1999.

[2]R. Korfhage.Information Storage and Retrieval, New York: John Wiley, 1997.

[3]G. SaltonandM. J. McGill.Introduction to Modern Information Retrieval,New York: McGraw-Hill, 1983.


[4]R. Baeza-Yates, EDS.Information Retrieval: Data Structures and Algorithm’s,Englewood Cliffs (NJ): Prentice-Hall, 1992, 241–263.



[5]Weigo Fan, Linda Wallace, Stephanie RichandZhongju Zhang. “Tap-ping into the Power of Text Mining”,Journal the Communications of ACM 2205.

[6]Rada Mihalcea.IR models: Vectorial Model.http://www.cs.unt.edu/ rada/CSCE5300.Some slides in this set were adapted from an IR course taught by Ray Mooneyat UT Austin, 2004.

[7]K. Spark, S. WalkerandS. E. Robertson.A probabilistic model informationretrieval: develoment and status, Computer Laboratory, University of Cambridgeand Microsoft Research Limited, 1998.

[8]Norbert FuhrandChris Buckley.A probabilistic Learning Approach forDocument Indexing, TH Darmtadt Germany and Cornell University, NY USA,1994.

[9]Norbert FuhrandUlrich Pfeifer.Probabilistic Information Retrieval asCombination of Abstraction, Inductive Learning and Probabilistic Assumptions,University of Dortmund, Dortmund, Germany.

[10]C. J. Rijsbergen Van. “A theoretical basis for the use of co-occurrence data ininformation retrieval”,Journal of Documentation,33(1977), 106–119.