Palabras El Quijote con wordcloud
A continuación vemos como crear una nube de palabras o wordcloud con las palabras de uno de los libros más leídos mundialmente. Don Quijote de la Mancha, escrito por Miguel de Cervantes en 1605.
Una nube de palabras representa:
- 💬 Las palabras presentes en un texto.
- 🌟 Donde las palabras más usadas se representan de manera más grande.
from wordcloud import WordCloud
import matplotlib.pyplot as plt
with open("quijote_wordcloud.txt", "r", encoding="utf-8") as file:
quijote = file.read()
wc = WordCloud(background_color="white", width=700, height=400)
wc.generate(quijote)
plt.figure(figsize=(10, 5))
plt.imshow(wc)
plt.axis("off")
plt.tight_layout()
plt.show()
Como podemos ver en la siguiente imagen, las palabras mas comunes son preposiciones, conjunciones o artículos, pero también tenemos algunas interesantes:
- Qujote
- Vuestra merced
- Sancho Panza
✏️ Ejercicios:
- Como puedes observar, las palabras más comunes son
y
,que
ola
. Esto es común en cualquier texto ya que las conjunciones, preposiciones y artículos son usadas en cualquier. Pero no dicen mucho. Usa el argumentostopwords
para ignorar estas palabras.