Introduction to Text Classification in R with quanteda

von
In diesem angeleitetes Projekt werden Sie:

Import text documents, reshape texts from documents to paragraphs, and turn your texts into a machine readable format.

Classify presidential concession speeches by political party using a Naive Bayes algorithm and assess the accuracy of the predictions.   

2 hours
Anfänger
Kein Download erforderlich
Video auf geteiltem Bildschirm
Englisch
Nur Desktop

In this guided project you will learn how to import textual data stored in raw text files into R, turn these files into a corpus (a collection of textual documents), reshape them into paragraphs from documents and tokenize the text all using the R software package quanteda. You will then learn how to classify the texts using the Naive Bayes algorithm. This guided project is for beginners interested in quantitative text analysis in R. It assumes no knowledge of textual analysis and focuses on exploring textual data (US Presidential Concession Speeches). Users should have a basic understanding of the statistical programming language R.

Kompetenzen, die Sie erwerben werden

  • Ordered Pair

  • Text Analysis

  • Algorithms

  • Statistical Programming Languages

  • Computer Programming

Schritt für Schritt lernen

In einem Video, das auf einer Hälfte Ihres Arbeitsbereichs abgespielt wird, führt Sie Ihr Dozent durch diese Schritte:

  1. Load text documents into R studio, convert a number of text documents into a corpus, and extract data from text document file names and add them to a new column in a dataframe. 

  2. Reshape the dataset into paragraphs from documents and check for balance in your labels. 

  3. Split up a text document corpus into tokens, or individual words and punctuations. Then clean the data by removing specific words and spellings.

  4. Create a Document Feature Matrix, divide it into train and test sets and run a Naive Bayes model. Then examine the model’s prediction accuracy and learn about accuracy, precision, and recall.   

  5. Run Naive Bayes models for a second and third time. Then examine the models' predictions and compare the model outputs with results from the previous task.

Ablauf angeleiteter Projekte

Ihr Arbeitsbereich ist ein Cloud-Desktop direkt in Ihrem Browser, kein Download erforderlich

Ihr Dozent leitet Sie in einem Video mit geteiltem Bildschirm Schritt für Schritt an.

Häufig gestellte Fragen

Mit dem Kauf eines angeleiteten Projekts erhalten Sie alles, was Sie zum Abschließen des angeleiteten Projekts benötigen, einschließlich des Zugriffs auf einen Cloud-Desktop-Arbeitsbereich über Ihren Webbrowser, der die Dateien und Software enthält, die Sie für den Start benötigen, sowie schrittweise Videoanweisungen von einem Fachexperten.

Da Ihr Arbeitsbereich einen Cloud-Desktop enthält, der für einen Laptop oder Desktop-Computer ausgelegt ist, sind angeleitete Projekte auf Ihrem Mobilgerät nicht verfügbar.

Die Dozenten bei angeleiteten Projekten sind Fachexperten, die Erfahrung in den Fähigkeiten, Werkzeugen oder Bereichen der jeweiligen Projekte haben und leidenschaftlich daran interessiert sind, ihr Wissen weiterzugeben und so Millionen von Lernenden auf der ganzen Welt zu beeinflussen.

Sie können alle von Ihnen erstellten Dateien aus dem angeleiteten Projekt herunterladen und speichern. Zu diesem Zweck können Sie die Funktion „Dateibrowser“ verwenden, wenn Sie auf Ihren Cloud-Desktop zugreifen.

Bei angeleiteten Projekten ist keine Erstattung möglich. Lesen Sie unsere komplette Rückerstattungsrichtlinie.

Für angeleitete Projekte ist keine finanzielle Unterstützung verfügbar.

Für angeleitete Projekte ist kein Auditing verfügbar.

Oben auf der Seite können Sie auf das Erfahrungsniveau für dieses angeleitete Projekt klicken, um das vorausgesetzte Wissen anzuzeigen. Auf jedem Niveau führt der Dozent Schritt für Schritt durch das angeleitete Projekt.

Ja, alles, was Sie zum Abschließen Ihres angeleiteten Projekts benötigen, finden Sie auf einem Cloud-Desktop, der in Ihrem Browser verfügbar ist.

Sie lernen durch Praxis, indem Sie Aufgaben in einer Split-Screen-Umgebung direkt in Ihrem Browser erledigen. Auf der linken Seite des Bildschirms erledigen Sie die Aufgabe in Ihrem Arbeitsbereich. Auf der rechten Seite des Bildschirms sehen Sie einen Dozenten, der Sie schrittweise durch das Projekt führt.