C’est une pratique très courante de nos jours de rechercher des informations sur Internet. Tout ce dont vous avez besoin n’est qu’à un clic de souris. Mais les résultats au début peuvent ne pas être exactement ce que vous attendiez, et puis nous devons lire ces petits paragraphes dans chaque lien juste pour comprendre de quoi il s’agit vraiment. Ces paragraphes représentent des résumés de l’article principal. Comme l’Internet est chargé avec des millions d’informations tous les jours à partir de pages Web, des nouvelles, des blogs, des recherches, etc. résumer manuellement un très long texte peut être assez pénible, surtout si vous devez gagner du temps.
Google, Yahoo, et d’autres moteurs de recherche utilisent des outils de résumé automatique de texte afin de résumer tous les textes longs. Un résumé est avant tout un système qui extrait des phrases d’un document, en identifie les plus pertinentes et les réorganise sous une forme structurée et lisible, mais beaucoup plus courte. Dans le traitement du langage naturel, la synthèse automatique des textes aide les systèmes à analyser et à comprendre le langage humain.
Deux techniques principales pour la compression automatique de texte incluent :
- Méthode d’extraction
- Méthode abstraite
La portée de la compression de texte est déterminée en fonction du type d’entrée, de l’objet, du domaine ou de la requête et du type de sortie.
La méthode extractive consiste à choisir des phrases et des phrases à partir d’un document original afin de créer des résumés. Il les classe par ordre de pertinence, en choisissant le plus pertinent pour le document source.
La méthode abstraite produit des phrases complètement nouvelles et des phrases qui reflètent l’essence du document original. Il offre des résultats plus réalistes et est plus stimulant, mais il est utilisé par les humains. Il fonctionne en choisissant et en réduisant le contenu de l’original, mais il peut produire des mots qui ne sont pas dans le document source original.
La méthode abstraite est considérée comme une solution générale au problème de l’abstraction, tandis que la méthode extractive est plus efficace et largement utilisée en raison de sa disponibilité et de son approche facile.