Sprachtechnologie in den Digital Humanities

Sprachtechnologie in den Digital Humanities

Taught in German

2,551 already enrolled

Course

Gain insight into a topic and learn the fundamentals

Instructors: Martin Volk

Included with Coursera Plus

4.8

(22 reviews)

Beginner level

No prior experience required

19 hours to complete

3 weeks at 6 hours a week

Flexible schedule

Learn at your own pace

Skills you'll gain

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

9 quizzes

See how employees at top companies are mastering in-demand skills

Learn more about Coursera for Business

Earn a career certificate

Add this credential to your LinkedIn profile, resume, or CV

Share it on social media and in your performance review

There are 6 modules in this course

AKTUELL:

Am 20.05.2019 startet die vorläufig letzte Runde des MOOCs "Sprachtechnologie in den Digital Humanities". Anschliessend wird der Kurs auf der Plattform Coursera pausiert, d.h. Einschreibungen in den Kurs werden ab diesem Datum nicht mehr möglich sein. Die Videos bleiben aber nach wie vor über unseren YouTube-Kanal (https://www.youtube.com/channel/UChb3Rd5vo3WEgMSy99VInaw) bzw. den SwitchTube-Kanal der Uni Zürich (https://tube.switch.ch/channels/bb3adc02) sichtbar. Die Pausierung dient primär zur Aktualisierung und Erweiterung der Kursinhalte und Lernmaterialien. KURS-BESCHREIBUNG: Sie möchten wissen, was genau die Digitalisierung von Texten beinhaltet? Sie haben sich schon immer gefragt, wie Texte in einem Korpus optimal durchsuchbar gemacht werden? Sie wundern sich, wie Texte mit linguistischen Informationen angereichert werden können? Dann sind Sie in diesem Kurs genau richtig!! Er bietet einen Überblick über die wichtigsten Konzepte und Probleme bei der Digitalisierung und Annotation von geschriebenen Texten. In sechs thematischen Modulen verteilt auf sechs Wochen lernen Sie relevante Technologien und Werkzeuge kennen. Jedes Modul beinhaltet zwei bis drei Videos (10-20 Minuten), ein Quiz oder ein Peer-Assessment sowie kurze Hintergrundtexte und weiterführende Links zu ausgewählten Themen. Für wen ist dieser Kurs interessant: Dieser Kurs richtet sich an Korpuslinguist/-innen, an Geisteswissenschaftler/-innen und Sprachinteressierte, die von einer rein sprachwissenschaftlichen Perspektive ausgehend auch ein paar Schritte in die Welt der Digitalisierung von Texten wagen und die dahinterstehenden Technologien kennenlernen möchten. Für diesen Kurs brauchen Sie keine Programmierkenntnisse. Mit Interesse an der Digitalisierung und Annotation von Texten sind Sie bestens gerüstet für diesen Kurs. Wir freuen uns, mit Ihnen diese digitalen Wege zu beschreiten, die in den Geisteswissenschaften immer wichtiger werden.

In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!

What's included

3 videos4 readings2 quizzes5 discussion prompts

3 videosTotal 49 minutes

1.1 - Wege in die digitale Welt20 minutesPreview module
1.2 - Herausforderungen bei der Korpusakquisition16 minutes
1.3 - Digitalisierungszentrum ZB12 minutes

4 readingsTotal 35 minutes

Die Dozenten dieses MOOC's10 minutes
Guidelines zur Bearbeitung des MOOCs10 minutes
Lernziele Modul 15 minutes
Material Modul 110 minutes

2 quizzesTotal 60 minutes

Was wissen Sie bereits zum Thema Digitalisierung?30 minutes
Testen Sie Ihr Wissen zum Thema Korpusakquisition30 minutes

5 discussion promptsTotal 70 minutes

Herzlich Willkommen zum MOOC!10 minutes
Hands-on: Mein erstes Korpus30 minutes
[EXKURS] Digitalisierung: Von der Buchseite zum Digitalisat10 minutes
Exkurs: Sprachtechnologie im Bank- und Finanzwesen10 minutes
Exkurs: Möglichkeiten der automatischen Textvereinfachung im Finanzwesen10 minutes

In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!

What's included

2 videos3 readings2 quizzes2 discussion prompts

2 videosTotal 44 minutes

2.1 - XML-Standards zur Textrepräsentation23 minutesPreview module
2.2 - Textsegmentierung21 minutes

3 readingsTotal 30 minutes

Lernziele Modul 25 minutes
Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten15 minutes
Material Modul 210 minutes

2 quizzesTotal 60 minutes

XML und TEI P5: Wie viel wissen Sie bereits?30 minutes
Testen Sie Ihr Wissen zum Thema Textsegmentierung30 minutes

2 discussion promptsTotal 30 minutes

Barrierefreiheit durch Sprachtechnologie10 minutes
Wohlgeformtheit eines XML-Dokuments20 minutes

In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!

What's included

3 videos3 readings2 quizzes1 peer review1 discussion prompt

3 videosTotal 91 minutes

3.1 - Eigenschaften von Korpora und Analysemethoden31 minutesPreview module
3.2 - Hands-on Korpusanalysen27 minutes
3.3 - Visualisierung und graphische Darstellung32 minutes

3 readingsTotal 25 minutes

Lernziele Modul 35 minutes
Visuelle Bergtour durch ein Kollokationsnetz10 minutes
Material Modul 310 minutes

2 quizzesTotal 60 minutes

Theorie: Grundbegriffe der Korpuslinguistik30 minutes
Praxis: Korpusabfragen und Analysemethoden30 minutes

1 peer reviewTotal 90 minutes

Korpusrecherche90 minutes

1 discussion promptTotal 10 minutes

Erfahrung mit Korpora10 minutes

In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!

What's included

3 videos3 readings2 quizzes2 discussion prompts

3 videosTotal 63 minutes

4.1 - Bestimmung von Wortarten und Grundformen29 minutesPreview module
4.2 - Erkennung, Klassifikation und Linking von Named Entities17 minutes
4.3 - Syntaktische Analyse16 minutes

3 readingsTotal 25 minutes

Lernziele Modul 45 minutes
Named Entities in der Praxis10 minutes
Material Modul 410 minutes

2 quizzesTotal 60 minutes

Wortarten und Grundformen automatisch bestimmen30 minutes
Testen Sie Ihr Wissen zu NER und Syntaxanalyse30 minutes

2 discussion promptsTotal 20 minutes

Was sind eigentlich Chatbots?10 minutes
Parsing: Was ist das eigentlich?10 minutes

In Modul 5 beschäftigen wir uns mit der Frage, wie eine möglichst ökonomische Annotation aussehen kann und wie sich manuelle und automatische Annotation mit Hilfe von maschinellem Lernen ergänzen können. Wir besprechen außerdem, wie wir die Qualität bzw. die Genauigkeit der Annotation gewährleisten und evaluieren können. Im zweiten Teil geht es dann um das sogenannte "Crowdsourcing", wo über Online-Plattformen Daten für diverse Projekte gesammelt bzw. korrigiert werden. Viel Spaß in der vorletzten Woche!

What's included

2 videos3 readings1 peer review1 discussion prompt

2 videosTotal 52 minutes

5.1 - Manuelle Annotation und Evaluation32 minutesPreview module
5.2 - Möglichkeiten und Probleme beim Crowdsourcing19 minutes

3 readingsTotal 25 minutes

Lernziele Modul 55 minutes
Evaluationsmaße: Wie gut funktioniert unser Modell?10 minutes
Material Modul 510 minutes

1 peer reviewTotal 90 minutes

Evaluation von NER-Tagging90 minutes

1 discussion promptTotal 10 minutes

Persönliche Erfahrungen mit Crowdsourcing10 minutes

Im letzten Modul befassen wir uns mit multilingualen bzw. parallelen Korpora. Im ersten Teil geht es um die automatische Sprach-Identifikation in gemischtsprachlichen Korpora, die einen wichtigen Schritt bei der Verarbeitung der Texte darstellt. Im zweiten Teil geht es um die automatische Satz- bzw. Wortalignierung zwischen parallelen Texten in unterschiedlichen Sprachen. Viel Spaß in der letzten Woche!

What's included

2 videos3 readings1 quiz8 discussion prompts

2 videosTotal 30 minutes

6.1 - Automatische Sprachidentifikation12 minutesPreview module
6.2 - Sprachübergreifende Alignierung17 minutes

3 readingsTotal 25 minutes

Lernziele Modul 65 minutes
Vom Babelfisch zur maschinellen Übersetzung10 minutes
Material Modul 610 minutes

1 quizTotal 30 minutes

Fast geschafft: Sprachidentifikation & Alignierung30 minutes

8 discussion promptsTotal 105 minutes

Exkurs: Maschinelle Übersetzung und Sentimentanalyse in der Finanz- und Versicherungsbranche10 minutes
Sprachtechnologie für Chinesisch10 minutes
Automatische Textgenerierung15 minutes
Feedback und Dankeschön!10 minutes
[ZUSATZ] Distributionelle Semantik: Kontext und Kollokationen15 minutes
[ZUSATZ] Distributionelle Semantik: Wortrepräsentationen und Vektoren15 minutes
[ZUSATZ] Distributionelle Semantik: Assoziationsmetriken und Ähnlichkeitsmaße15 minutes
[ZUSATZ] Distributionelle Semantik: Clustering und Visualisierung15 minutes

Instructors

Martin Volk

University of Zurich

1 Course2,551 learners

Noah Bubenhofer

University of Zurich

1 Course2,551 learners

Simon Clematide

University of Zurich

1 Course2,551 learners

Offered by

University of Zurich

Recommended if you're interested in Data Analysis

University of Zurich
Nachhaltigkeit lehren lernen
Course
Johns Hopkins University
الحصول على البيانات وتنظيفها
Course
Johns Hopkins University
تحليل البيانات الاستكشافية
Course
University of California San Diego
مقدمة عن البيانات الضخمة
Course

Why people choose Coursera for their career

Felipe M.

Learner since 2018

"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."

Jennifer J.

Learner since 2020

"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."

Larry W.

Learner since 2021

"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."

Chaitanya A.

"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."

Learner reviews

Showing 3 of 22

4.8

22 reviews

5 stars
81.81%
4 stars
13.63%
3 stars
4.54%
2 stars
0%
1 star
0%

Reviewed on Nov 18, 2017

View more reviews

New to Data Analysis? Start here.

Open new doors with Coursera Plus

Unlimited access to 7,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription

Learn more

Advance your career with an online degree

Earn a degree from world-class universities - 100% online

Explore degrees

Join over 3,400 global companies that choose Coursera for Business

Upskill your employees to excel in the digital economy

Learn more

Frequently asked questions

Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.

When you purchase a Certificate you get access to all course materials, including graded assignments. Upon completing the course, your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

You will be eligible for a full refund until two weeks after your payment date, or (for courses that have just launched) until two weeks after the first session of the course begins, whichever is later. You cannot receive a refund once you’ve earned a Course Certificate, even if you complete the course within the two-week refund period. See our full refund policy.

Sprachtechnologie in den Digital Humanities

Course

Skills you'll gain

Details to know

See how employees at top companies are mastering in-demand skills

Earn a career certificate

There are 6 modules in this course

Woche 1 - Wege in die digitale Welt

What's included

Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten

What's included

Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden

What's included

Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen

What's included

Woche 5 - Manuelle Annotation und Evaluation von Korpusdaten

What's included

Woche 6 - Herausforderungen der Multilingualen Textanalyse

What's included

Instructors

Offered by

Recommended if you're interested in Data Analysis

Nachhaltigkeit lehren lernen

الحصول على البيانات وتنظيفها

تحليل البيانات الاستكشافية

مقدمة عن البيانات الضخمة

Why people choose Coursera for their career

Learner reviews

New to Data Analysis? Start here.

Open new doors with Coursera Plus

Advance your career with an online degree

Join over 3,400 global companies that choose Coursera for Business

Frequently asked questions

When will I have access to the lectures and assignments?

What will I get if I purchase the Certificate?

What is the refund policy?

More questions