Etymologie, Étymologie, Etymology
DE Deutschland, l'Allemagne, Germany
Statistik, Statistique, Statistics
A
B
C
D
E
F
G
H
I
ids-mannheim - Institut für Deutsche Sprache - Statistik von Wortformen - 100 am meisten gesprochenen Worten in Deutsch
(E?)(L1) http://www.ids-mannheim.de/
(E?)(L1) http://www.ids-mannheim.de/quellen/
(E?)(L1) http://www.ids-mannheim.de/kt/30000wordforms.dat
Am 07.08.2004 stellte Christian Scholz die Frage:
Ich bin gerade auf der Suche nach den 100 am meisten gesprochenen Worten in Deutsch. Können Sie mir vielleicht weiterhelfen, da ich über Google und Yahoo keinen Erfolg hatte. Ich bin auch an den 100 am meisten gesprochenen Worten in Spanisch interessiert.
Eine exakte Antwort auf diese Frage kann ich leider nicht geben. Aber auf den Seiten des IDS Mannheim gibt es immerhin eine Liste der 30.000 häufigsten Wortformen aus den Textkorpora des IDS, absteigend sortiert nach relativer Häufigkeit.
Dort waren am 11.08.2004 als erste 100 Wörter angegeben:
der | die | und | in | den | von | zu | mit | das | sich | für | im | ist | auf | des | nicht | Die | dem | ein | eine | als | auch | es | an | aus | sie | werden | er | hat | Der | nach | am | bei | wird | einer | um | wie | daß | sind | noch | vor | einem | über | Das | einen | zum | nur | war | so | haben | aber | bis | oder | zur | mehr | Uhr | man | sein | In | wurde | sei | durch | hatte | gegen | vom | Sie | ich | kann | unter | schon | wir | wenn | habe | Mark | ihre | wieder | Prozent | Jahren | Es | seine | zwei | dann | soll | können | immer | Und | dass | Jahr | Ein | Im | eines | keine | will | was | Jahre | seiner | dieser | worden | Er | diese
Da sich gesprochene und schriftlich fixierte Sprache natürlich unterscheiden, ist dies nur eine Annäherung zur gestellte Frage.
Aber vielleicht kennt ein Besucher des Etymologie-Portals eine entsprechende Untersuchung "in der freien Natur" und sendet mir eine paar Hinweise.
Auf der "Quellen-Seite" findet man weitere - auch statistisch - interessante Hinweise:
- Informationen zur deutschen Sprache
- Wort / Unwort des Jahres
- häufige Vornamen
- häufige Wörter
- German courses for foreigners, Deutschkurse für Ausländer
- Bibliografie zu Anglizismen
- Deutsch lernen / lehren
- Server für DaF
- Wörterbücher, Grammatiken, Textsammlungen
- Quellen zur Landeskunde
- Didaktisierte Materialien, Sprachkurse
- Angebote für Lehrer
- Allgemeine Quellen zur Linguistik
- Linguistische Fachzeitschriften,
- linguistische Konferenzen,
- Adressen von Linguisten,
- linguistische Mailinglisten,
- Bibliografien zur Linguistik.
- Quellen zur germanistischen Linguistik
- Linguistische Forschungsprojekte,
- linguistische Tagungen in Deutschland, Österreich und der Schweiz
- Vereine, Verbände für germanistische Linguistik
- Internet-Studienführer
J
K
L
M
memodata - Worthäufigkeitsliste deutscher Wörter
(E?)(L1) http://www.memodata.com/2004/de/wortliste/index.shtml
Die vorliegende Liste stellt eine Worthäufigkeits-Statistik der deutschen Sprache dar, wobei wir uns bei der Erstellung auf die Webangebote großer Magazine und Zeitungen beschränkt haben, d.h. es handelt sich nicht um die Auswertung eines "repräsentativen" Korpus (kann ein solcher überhaupt im idealen Sinne existieren...?).
Auf der Seite präsentieren wir die ersten 3350 Ränge (rund 20000 Wörter).
(E?)(L?) http://www.memodata.com/2004/de/wortliste/1_1000.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/1001_2000.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/2001_2500.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/2501_2800.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/2801_3100.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/3101_3300.shtml
(E?)(L?) http://www.memodata.com/2004/de/wortliste/3301_3350.shtml
mpib-berlin - PISA
(E?)(L?) http://www.mpib-berlin.mpg.de/pisa
ist Teil des Indikatorenprogramms INES ("Indicators of Educational Systems") der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD). Generelle Zielsetzung des Projekts ist es, OECD-Staaten Indikatoren für Wissen, Fähigkeiten und Fertigkeiten von 15jährigen Schülern in den Bereichen Leseverständnis, Mathematik und Naturwissenschaften in Zeitreihe zur Verfügung zu stellen.
N
O
P
Q
R
S
Statistik (W3)
(E3)(L1) http://de.wikipedia.org/wiki/Statistik
Die "Statistik" kommt aus Frankreich. Dort heisst sie "statistique" und geht auf lat. "status" = "Stand", Verfassung" und weiter auf lat. "stare" = "stehen". Bevor sie sich zur mathematischen Disziplin entwickelte war sie also die "Wissenschaft vom Staat" und beschrieb die Lebensbedingungen der Menschen in den verschiedenen Ländern.
Da die Beschreibung des Staats-Zustandes und der Länder aber meist mit Hilfe von Zahlenangaben, Zahlenvergleichen und Rechnereien verbunden war, kam die "Statistik" immer mehr auf die Mathematik.
T
theateraufcd - Alle Wörter der deutschen Sprache ...
(E?)(L?) http://www.theateraufcd.de/wortanalyse.htm
...
Wenn wir als längstes Wort "Donaudampfschiffahrtsgesellschaftskapitän" annehmen, gibt es theoretisch 59**41 = 4,0265442607784546640776474099421e+72 verschiedene Wörter.
...
U
Uni Leipzig - häufigste Wörter DE, FR, NL, UK
(E?)(L?) http://wortschatz.uni-leipzig.de/
In der Kategorie "Wortlisten findet man Listen mit den häufigsten Wörtern in den Sprachen Deutsch, Englisch, Französisch und Niederländisch. Die Listen sind jeweils nach Häufigkeit sortiert und basieren auf den von uns ausgewerteten Quellen. Für andere Quellen ergeben sich sicher andere Reihenfolgen, da die Anzahlen stark von Textsorte, Fachgebiet usw. abhängen.
Download der häufigsten Wörter: ++ 100 ++ 1000 ++ 10000 ++
- Rangliste der deutschen Wörter
- Rangliste der französischen Wörter:
- Rangliste der niederländischen Wörter
- Rangliste der englischen Wörter:
Uni Leipzig - Wörterbuch Deutsch-Englisch
Häufigkeiten aus dem Wortschatz
(E?)(L?) http://dict.uni-leipzig.de/
Hier haben Sie den Zugriff auf ca. 400.000 Einträge aus ca. 90.000 englischen und ca. 150.000 deutschen Wörtern. Bitte einen deutschen oder englischen Begriff eingeben und auf "nachschlagen!" drücken.
V
W
wispor - Sprachliche Besonderheiten
(E?)(L?) http://www.wispor.de/wpx-ku1b.htm
wissenschaft-online - Wortpaare
(E?)(L?) http://www.wissenschaft-online.de/abo/ticker/595348
(E?)(L?) http://www.ibiblio.org/pub/docs/books/gutenberg/etext02/mthes10.zip
Moby Thesaurus II
... zumindest in der englischen Sprache lassen sich zwei beliebige Standard-Vokabeln über drei Begriffe ähnlicher Bedeutung miteinander verbinden.
Zu diesem Ergebnis kamen Adilson Motter von der Arizona State University in Tempe und seine Kollegen, als sie die Verknüpfungen des frei erhältlichen "Moby Thesaurus II" (9,42MB) untersuchten. Das Wörterbuch umfasst 30 000 Einträge, wobei jedem im Schnitt hundert verwandte Begriffe zugeordnet sind. Die Wissenschaftler beschränkten sich bei ihrer Analyse jedoch ausschließlich auf bestimmte Hauptwörter, die sprachlich geläufig sind. Aus ihnen bauten sie einen Netzwerk aus verwandten Wörtern, wobei jeder Knoten (ein Begriff) mit etwa 60 anderen Knoten verbunden war.
So haben die Begriffe "Schauspieler" und "Universum" auf den ersten Blick nicht viel miteinander gemein - auf den zweiten jedoch schon. Denn die beiden Worte lassen sich anhand des Moby Thesaurus II tatsächlich über einen kurzen Weg miteinander verbinden: Die erste Station der Reise führt vom actor (Schauspieler) zum character (Charakter). Unter den synonymen Begriffen zu character findet sich dann auch nature (Natur, Wesen, Charakter), wo dann schließlich auch der Verweis auf universe steht. Alles nur Zufall? Mitnichten, laut Motter gilt das für beliebige Wortpaare - vorausgesetzt, es handle sich um geläufige Begriffe. ...
Wortanzahl - Anzahl möglicher Wörter (W3)
Manchmal wundert man sich ja wirklich, wieviele Wörter existieren. Nimmt man ein mehrbändiges deutsches Wörterbuch zur Hand, dann hat man den Eindruck, dass alle Buchstabenkombinationen bereits gebildet wurden. Nimmt man dann aber ein ebenfalls mehrbändiges französisches Lexikon zur Hand eröffnet sich wieder ein neues Universum mit vielen neuen Buchstabenkombinationen. Und so kann man fortfahren mit englischen, spanischen, italienischen Wörterbüchern. Und man kommt zu dem Eindruck, dass ein Ende überhaupt nicht mehr absehbar ist. Sind doch zum Beispiel mundartliche Ausdrücke und Dialekte in allen Sprachen noch weitere Quellen von Buchstabenkombinationen.
Rein rechnerisch sind folgende mögliche Wörter mit x Buchstaben möglich:
Anzahl der Buchstaben Theoretisch mögliche Kombinationen
1 26
2 676
3 17.576
4 456.976
5 11.881.376
6 308.915.776
7 8.031.810.176
8 2,08827E+11
9 5,4295E+12
10 1,41167E+14 = 100.000.000.000.000
11 3,67034E+15
12 9,5429E+16
13 2,48115E+18
14 6,451E+19
15 1,67726E+21
16 4,36087E+22
17 1,13383E+24
18 2,94795E+25
19 7,66467E+26
20 1,99281E+28
In dieser Tabelle sind die vielen Sonderzeichen der unterschiedlichen Sprachen noch nicht berücksichtigt. Auch Wörter, die mehr als 20 Buchstaben haben sind nicht vorgesehen. Andererseits ist auch nicht berücksichtigt, dass bestimmte Buchstabenkombinationen nicht auftreten können, wie z.B. "AAAAAAA" - es sei denn, man schliesst Comic-Ausdrücke und damit die ganze Bandbreite lautmalerischer Buchstabenkombinationen mit ein.
Jedenfalls dürfte es kein Problem darstellen, mehrere Milliarden (=10E+9) oder Billionen (10E+12) Wörter zu bilden. Hier ist also noch jede Menge Spielraum gegeben. Ohne Fremdwörter und Neologismen hat man überhaupt keine Chance dieses Potential auszuschöpfen.
X
Y
Z