You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
No notebook de implementação do Bag-of-Words foi inserido um histograma de classes, mostrando a quantidade de observações de cada uma das 6 classes existentes no dataset.
Número de termos, termos mais frequentes e menos frequentes por categoria e geral
Gráfico Número de ocorrências x Número máximo de ocorrências de um mesmo termo num documento
Obter a média acima (ou seja, a média de um termo aparecer repetidamente num documento, isso nos ajudará a definir um termômetro na binarização)
Gráfico Ranking de termos com maior TF-IDF
Gráfico Número de ocorrências x Número de termos na documento
Referência:
https://www.kaggle.com/adhok93/initial-analysis-using-tidytext
https://www.kaggle.com/sudalairajkumar/simple-leaky-exploration-notebook-quora
The text was updated successfully, but these errors were encountered: