Explore la classification des données textuelles, en se concentrant sur des méthodes telles que les bayes naïques et les techniques de réduction de la dimensionnalité telles que l'analyse des composantes principales.
Explore les méthodes d'extraction de l'information, y compris les approches traditionnelles et fondées sur l'intégration, l'apprentissage supervisé, la surveillance à distance et l'induction taxonomique.
Présente une méthode de détection d'événements à partir de nouvelles utilisant des ressources limitées, ce qui la rend robuste au bruit et à l'indépendant de la langue.