06-03-2014, 12:42 PM
Los stopwords son palabras muy frecuentes en un idioma que apenas nos aportan información. Los propios buscadores tienen en cuenta los stopwords para mejorar sus búsquedas. Un listado de stopwords mayoritariamente está compuesto de pronombres, adverbios, conjunciones, verbos, adjetivos y preposiciones.
Poniendo un ejemplo de stopwordps marcaremos con S, la frase original es "El gobierno de España ha subido los impuestos", por lo que quedaría "S gobierno S España S subido S impuestos" (dependerá de nuestro listado, pero subido es muy probable que no lo considere stopword). Se emplean mucho en las urls amigables para que estas no se hagan muy largas y contengan las palabras que más información nos aporta del título en la url amigable.
Aquí os dejo 4 webs donde encontrar listas de stopwords en varios idiomas, entre ellos español:
http://snowball.tartarus.org/
http://www.ranks.nl/resources/stopwords.html
http://members.unine.ch/jacques.savoy/clef/
https://code.google.com/p/stop-words/
Poniendo un ejemplo de stopwordps marcaremos con S, la frase original es "El gobierno de España ha subido los impuestos", por lo que quedaría "S gobierno S España S subido S impuestos" (dependerá de nuestro listado, pero subido es muy probable que no lo considere stopword). Se emplean mucho en las urls amigables para que estas no se hagan muy largas y contengan las palabras que más información nos aporta del título en la url amigable.
Aquí os dejo 4 webs donde encontrar listas de stopwords en varios idiomas, entre ellos español:
http://snowball.tartarus.org/
http://www.ranks.nl/resources/stopwords.html
http://members.unine.ch/jacques.savoy/clef/
https://code.google.com/p/stop-words/