Vol. 10 Núm. 1 (2011): Revista UIS Ingenierías
Artículos

Algoritmos de expansión de consulta basados en una nueva función discreta de relevancia

Carlos Alberto Cobos-Lozada
Universidad del Cauca
Biografía
Eduardo Estevez-Mendoza
Universidad Industrial de Santander
Biografía
Martha Eliana Mendoza-Becerra
Universidad del Cauca
Biografía
Luis Carlos Gómez-Flórez
Universidad Industrial de Santander
Biografía
Elizabeth León-Guzmán
Universidad Nacional de Colombia
Biografía

Publicado 2011-06-15

Palabras clave

  • Expansión de consulta,
  • rocchio,
  • término relevante,
  • IDF,
  • frecuencia invertida de documento

Cómo citar

Cobos-Lozada, C. A., Estevez-Mendoza, E., Mendoza-Becerra, M. E., Gómez-Flórez, L. C., & León-Guzmán, E. (2011). Algoritmos de expansión de consulta basados en una nueva función discreta de relevancia. Revista UIS Ingenierías, 10(1), 7–20. Recuperado a partir de https://revistas.uis.edu.co/index.php/revistauisingenierias/article/view/7-20

Resumen

Se ha demostrado que el proceso de expansión de las consultas en el modelo espacio vectorial de representación dedocumentos en un sistema de recuperación de información, es una técnica útil para mejorar la relevancia medidapor la precisión de los resultados entregados a los usuarios. En este artículo se presenta un nuevo algoritmo y unavariación del mismo para realizar expansión de consultas en un sistema de recuperación de información. Estosalgoritmos se basan en una nueva función discreta que define la importancia relativa de un término en una colecciónde documentos. El algoritmo y su variación se evalúan frente a la búsqueda por similitud de cosenos y el algoritmode expansión propuesto por Rocchio, obteniendo excelentes resultados sobre la colección de datos CACM (artículospublicados en la revista Communications of the ACM).

Descargas

Los datos de descargas todavía no están disponibles.

Referencias

  1. Baeza-Yates, R., A. and B. Ribeiro-Neto, Modern Information Retrieval. 1999: Addison-Wesley Longman Publishing Co., Inc. 513.
  2. Manning, C., P. Raghavan, and H. Schütze, Introduction to Information Retrieval. 2008, Cambridge University Press: Cambridge, England.
  3. Rijsbergen, C.J.V., Information Retrieval. 1979: Butterworth-Heinemann. 208.
  4. Hammouda, K., Web Mining: Clustering Web Documents A Preliminary Review. 2001. p. 1-13.
  5. Yongli, L., et al., A Query Expansion Algorithm Based on Phrases Semantic Similarity, in Proceedings of the 2008 International Symposiums on Information Processing. 2008, IEEE Computer Society.
  6. Inna Gelfer, K. and K. Oren, Cluster-based query expansion, in Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval. 2009, ACM: Boston, MA, USA.
  7. Efthimiadis, E.N. Query Expansion. 1996 [cited 2011; in: Williams, Martha E., ed. Annual Review of Information Systems and Technology (ARIST), v31, pp 121-187, 1996]. Available from: http:// faculty.washington.edu/efthimis/pubs/Pubs/qearist/QE-arist.html.
  8. Robertson, S.E. and K. Sparck-Jones, Relevance weighting of search terms, in Document retrieval systems. 1988, Taylor Graham Publishing. p. 143- 160.
  9. Garcia, E. RSJ-PM Tutorial: A Tutorial on the Robertson-Sparck Jones Probabilistic Model for Information Retrieval. 2009; Available from: http://www.miislita.com/information-retrievaltutorial/information-retrieval-probabilisticmodel-tutorial.pdf.
  10. Biancalana, C. and A. Micarelli. Social Tagging in Query Expansion: A New Way for Personalized Web Search. in SocialCom-09 the 2009 IEEE International Conference on Social Computing. 2009. Vancouver, Canada.
  11. Marin, B., et al., Toward personalized query expansion, in Proceedings of the Second ACM EuroSys Workshop on Social Network Systems. 2009, ACM: Nuremberg, Germany.
  12. Dongsheng, Z. and W. Liqing. Study on Key Techniques of Query Expansion Based on Ontology and Its Application. in Computational Intelligence and Software Engineering, 2009. CiSE 2009. International Conference on. 2009.
  13. Nguyen, T.C. and T.T. Phan. An Ontology-Based Approach of Query Expansion. in iiWAS’2007 - The Ninth International Conference on Information Integration and Web-based Applications Services. 2007. Jakarta, Indonesia.
  14. Han, L. and G. Chen, HQE: A hybrid method for query expansion. Expert Systems with Applications, 2009. 36(4): p. 7985-7991.
  15. ASF. Class Similarity. [cited 2011 January 10, 2011]; Available from: http://lucene.apache.org/ java/2_9_0/api/core/org/apache/lucene/search/ Similarity.html.
  16. Porter, M.F., An algorithm for suffix stripping. Program, 1980. 14(3): p. 130-137.
  17. Dominich, S., The Modern Algebra of Information Retrieval. The Information Retrieval Series, ed. W.B. Croft. 2008: Springer-Verlag Berlin Heidelberg.
  18. IRG. Test collections. [cited 2011 January 15, 2011]; Available from: http://ir.dcs.gla.ac.uk/ resources/test_collections/.