Über diesen Kurs

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Anfänger“

Ca. 22 Stunden zum Abschließen

Empfohlen: 2 - 3 h/Woche, insg. 6 Wochen...

Deutsch

Untertitel: Deutsch, Englisch

Kompetenzen, die Sie erwerben

Natural Language ProcessingParsingDigital PreservationCorporaNamed-Entity Recognition

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Anfänger“

Ca. 22 Stunden zum Abschließen

Empfohlen: 2 - 3 h/Woche, insg. 6 Wochen...

Deutsch

Untertitel: Deutsch, Englisch

Lehrplan - Was Sie in diesem Kurs lernen werden

Woche
1
3 Stunden zum Abschließen

Woche 1 - Wege in die digitale Welt

In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!

...
3 Videos (Gesamt 49 min), 4 Lektüren, 2 Quiz
3 Videos
1.2 - Herausforderungen bei der Korpusakquisition16m
1.3 - Digitalisierungszentrum ZB12m
4 Lektüren
Die Dozenten dieses MOOC's10m
Guidelines zur Bearbeitung des MOOCs10m
Lernziele Modul 15m
Material Modul 110m
2 praktische Übungen
Was wissen Sie bereits zum Thema Digitalisierung?8m
Testen Sie Ihr Wissen zum Thema Korpusakquisition8m
Woche
2
2 Stunden zum Abschließen

Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten

In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!

...
2 Videos (Gesamt 45 min), 3 Lektüren, 2 Quiz
2 Videos
2.2 - Textsegmentierung21m
3 Lektüren
Lernziele Modul 25m
Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten15m
Material Modul 210m
2 praktische Übungen
XML und TEI P5: Wie viel wissen Sie bereits?12m
Testen Sie Ihr Wissen zum Thema Textsegmentierung6m
Woche
3
4 Stunden zum Abschließen

Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden

In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!

...
3 Videos (Gesamt 92 min), 3 Lektüren, 3 Quiz
3 Videos
3.2 - Hands-on Korpusanalysen27m
3.3 - Visualisierung und graphische Darstellung32m
3 Lektüren
Lernziele Modul 35m
Visuelle Bergtour durch ein Kollokationsnetz10m
Material Modul 310m
2 praktische Übungen
Theorie: Grundbegriffe der Korpuslinguistik6m
Praxis: Korpusabfragen und Analysemethoden6m
Woche
4
2 Stunden zum Abschließen

Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen

In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!

...
3 Videos (Gesamt 63 min), 3 Lektüren, 2 Quiz
3 Videos
4.2 - Erkennung, Klassifikation und Linking von Named Entities17m
4.3 - Syntaktische Analyse16m
3 Lektüren
Lernziele Modul 45m
Named Entities in der Praxis10m
Material Modul 410m
2 praktische Übungen
Wortarten und Grundformen automatisch bestimmen8m
Testen Sie Ihr Wissen zu NER und Syntaxanalyse10m
4.8
3 BewertungenChevron Right

Top reviews from Sprachtechnologie in den Digital Humanities

von DHNov 19th 2017

Sehr gut strukturierter Kurs! Man lernt viele aktuelle Methoden, Begriffe und Tools kennen, die man in dne unterschiedlichsten Projekten anwenden kann! Ein zeitnaher Kurs zu einem spannenden Thema!

Dozenten

Avatar

Martin Volk

Prof. Dr.
Institute of Computational Linguistics
Avatar

Noah Bubenhofer

Dr.
Institute of Computational Linguistics
Avatar

Simon Clematide

Dr. phil.
Institute of Computational Linguistics

Über Universität von Zürich

Founded in 1833, the University of Zurich (UZH) is Switzerland’s largest university, with a cur­rent enrollment of over 26,000 students. Made up of seven faculties covering approximately 100 different subject areas, UZH is proud to offer the most comprehensive aca­demic program in the country....

Häufig gestellte Fragen

  • Sobald Sie sich für ein Zertifikat angemeldet haben, haben Sie Zugriff auf alle Videos, Quizspiele und Programmieraufgaben (falls zutreffend). Aufgaben, die von anderen Kursteilnehmern bewertet werden, können erst dann eingereicht und überprüft werden, wenn Ihr Unterricht begonnen hat. Wenn Sie sich den Kurs anschauen möchten, ohne ihn zu kaufen, können Sie womöglich auf bestimmte Aufgaben nicht zugreifen.

  • Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugriff auf alle Kursmaterialien, einschließlich bewerteter Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Seite „Errungenschaften“ hinzugefügt – von dort können Sie Ihr Zertifikat ausdrucken oder es zu Ihrem LinkedIn Profil hinzufügen. Wenn Sie nur lesen und den Inhalt des Kurses anzeigen möchten, können Sie kostenlos als Gast an dem Kurs teilnehmen.

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..