L’analyse de contenu est une méthode d’analyse de données qualitatives. A l’appui des hypothèses et/ou objectifs de recherche, l’analyste tente de rendre explicite le contenu d’un message, d’un texte, d’une communication, d’en comprendre le sens (interprétation) en réduisant sa quantité (résumé). Ce travail passe par la construction et la mise en œuvre de règles et de procédures d’analyses qui donnent à l’analyse de contenu son caractère « objectif » et permettent à l’analyste de dépasser ses simples « intuitions ».
L’analyse de contenu permet ainsi l’inférence de connaissances, autrement dit l’interprétation de contenus, à partir d’un texte (articles de presse, transcription d’entretiens…) ou d’une image en relation avec des objectifs d’étude spécifiques. En d’autres mots, l’analyse de contenu rend explicite la signification des messages (interprétation) en réduisant son contenu (résumé). Il existe plusieurs types d’analyse de contenu : lexicale, syntaxique, structurale, évaluative, sémantique ou catégorielle…, cette dernière étant la plus couramment utilisée pour l’étude des significations d’un texte.
Pour ce faire, le chercheur peut utiliser deux moyens : analyse de contenu manuelle ou analyse de contenu automatisée à l’aide de logiciels d’analyse textuelle
Analyse manuelle avec une grille
Lorsque le corpus (ensemble des documents soumis à l’analyse) est délimité, l’analyste commence par une première lecture lui permettant de se faire une idée du contenu. Puis il s’attache à repérer les éléments de contenu permettant de répondre aux objectifs ou aux hypothèses qu’il s’est fixé. Ces éléments sont ensuite organisés et structurés au sein d’une grille d’analyse constituant le système de catégorisation. Ce système est donc constitué de catégories et sous-catégories qui regroupent des éléments selon un même principe. Le codage s’effectue en suivant les règles suivantes :
- exclusion mutuelle : chaque élément ne peut être affecté que dans une seule catégorie ;
- cohérence et homogénéité : la classification doit être cohérente en se basant sur un même principe pour l’organisation des catégories et en interdisant de mélanger différents niveaux d’analyse ;
- pertinence : les catégories doivent être adaptée au matériel d’analyse choisi, au cadre théorique et donc aux objectifs de la recherche. Autrement dit, les catégories doivent refléter les intentions et questions de l’étude ;
- objectivité et fidélité : lorsqu’ils sont soumis à plusieurs analystes ou juges, les textes analysés auxquels on applique la même grille de catégories, doivent être codés de la même manière. Si les catégories sont objectives, il n’y a pas ou peu de distorsions ;
- productivité : les catégories sont dites productives si elles permettent la production d’inférences, d’hypothèses nouvelles ou qu’elles apportent des données fiables ;
exhaustivité : tous les éléments susceptibles d’être relevés dans le message à analyser doivent trouver place au sein de l’une des catégories. Une catégorie « divers » ou « autres » peut éventuellement être créée mais ces catégories doivent être utilisées avec beaucoup de réserve. - Avant de procéder au codage final, le système de catégorisation est testé sur des extraits de texte.
Analyse automatique avec des logiciels
Aujourd’hui, l’analyse de contenu est caractérisée par le développement de l’informatisation des procédures. On retrouve par exemple des logiciels tels que Alceste ou Spad qui permettent la comparaison de corpus du point de vue lexical, ou des logiciels comme Tropes qui permettent d’effectuer des analyses propositionnelles. Certains logiciels sont payants et relativement coûteux, d’autres sont en accès libre.