Angielskie słówka

0

Gdzie można ściągnąć bazę z angielskimi słowami, najlepiej w zwykłym pliku txt.
Tylko takie popularne słówka, do 100 tyś. powiedzmy, w każdym razie nie jakieś ekstremalne wariactwa z milionami dziwnych haseł.

I ze znaczeniami, też w angielskim, np. takie coś:

ball An object in the shape of a sphere
target An object to shoot at
genius Extraordinary intelligence
Poland A country in Central Europe
Regan 40th President of the United States

0

To, że potrzebujesz jakichś danych nie oznacza, że dział ze słowem danych w nazwie jest właściwy.

0

@par Jest na przykład http://www.thefreedictionary.com/Poland ale wątpię żeby udostępniali gdzieś swoją bazę. Niemniej 100k to możesz pewnie sobie sam jakimś prostym crawlerem pociągnąć przez noc.

2

100k to są popularne słówka?
Szekspir używał jedynie 30k słów, przeciętny człowiek używa 12k (na co dzień tak naprawdę ok. 4k).

Źródła własne (czyli zapomniane/bez linka) oraz http://engleash.net/ile-slow-musisz-znac

0

http://www.ibiblio.org/webster/ Tu masz sporą bazę. Z tego co widziałem ma właśnie w miarę proste definicje, musiałbyś tylko wybrać z tego 100k słów których potrzebujesz i gotowe :)

0
Zellus napisał(a):

http://www.ibiblio.org/webster/ Tu masz sporą bazę. Z tego co widziałem ma właśnie w miarę proste definicje, musiałbyś tylko wybrać z tego 100k słów których potrzebujesz i gotowe :)

Nie działa mi to - wywala jakieś błędy xml.
A ten zip po rozpakowaniu jest raczej nieczytelny.

Tu znalazłem coś dobrego, ale tylko z 1000 słów:
http://cis.stvincent.edu/html/tutorials/swd/btree/btree.txt

dzek69 napisał(a):

100k to są popularne słówka?
Szekspir używał jedynie 30k słów, przeciętny człowiek używa 12k (na co dzień tak naprawdę ok. 4k).

Tak, zwykle jest chyba tylko do 30 tyś. słów popularnych, znaczy takich które zna każdy, i w dowolnym języku.
Ale gdy dodamy nazwy geograficzne: duże i znane miasta, państwa, góry, regiony,
potem popularne zwierzęta i rośliny, kwiaty, zioła, itp. i jeszcze nazwiska popularnych ludzi: aktorzy, sportowcy, politycy,
wówczas tego będzie już z 2 razy więcej = 60k, góra just 100k. :)

0

Tak Ci się wydaje :P Przeczytaj zalinkowany artykuł, nie wymyślaj liczb z kosmosu.

Ja sam kiedyś zebrałem wszystkie słowa z moich smsów z 2-3 miesięcy - ledwo kilka tysięcy. Oczywiście odrzuć wszelką odmianę, bo wiadomo, wtedy namnożysz tych słów (po angielsku już nie tak bardzo).

0

Pewnie ulegasz iluzji.
Pewnie wystarczy znać z 5000 słów aby się sprawnie porozumieć, a nawet lepiej: my tyle zwykle używamy w życiu codziennym.

Niemniej znasz 30000 tyś. i co najmniej, co zresztą można dość łatwo potwierdzić empirycznie:
kup sobie taki podręczny, kieszonkowy słownik, i tam chyba właśnie jest około 20 - 30 tyś. haseł.

I teraz otwieramy taki słowniczek na przypadkowej stronie i takim sposobem łatwo sprawdzimy czy znamy, rozumiemy te 30 tyś. haseł.
No i oczywiście tak będzie, bo trudno w takim słowniku znaleźć nieznane nam słowo, tym samy musimy znać niemal wszystkie, czyli minimum 30 tauzenów.

0

No to gratuluję erudycji;
znajomość aż 4000 słów to faktycznie niebywale wielka rzecz! :)

Zestawienie słów polskich:
user image

0

Kolejny, który nie rozróżnia "popularny" od "znany". I, o ironio jednocześnie próbuje mnie ośmieszyć, że to ja słów nie znam. Przynajmniej znam ich znaczenie, w przeciwieństwie do Ciebie, anonimowy kolego.

Spróbuję jasnym językiem napisać parę faktów:

  • słowa POPULARNE, używane na co dzień - ok. 4 000
  • słowa ogólnie znane każdemu - ok. 12 000
  • słowa łącznie występujące - ponad 100 000
  • liczby te nie uwzględniają odmiany, żadne przypadki, liczby, czasy, osoby
  • program powyżej posiada skromną bazę - głównie nazw własnych, które ciężko uznać za słowa jako-takie, odrzucając też zdrobnienia, liczby, skróty itd. - zostaje na oko 30k słów, z czego część zapewne jest do odrzucenia ze względu na odmianę

Mam nadzieję, że dotarło, jak nie dotarło - trudno

0

Tam są same rzeczowniki, podzielone wg trudności, i gramatyki: nazwy własne, odczasownikowe, itd.

I jest ponad 30 tyś. które każdy zna, czyli pospolitych - poziom 1: łatwe.

2: Średnio trudne; to są słowa znane przez większość uczniów, np.: izotop, izobar, neptun, parabola, skalar, asymptota, itp.

3: trudne; i tu mamy zwykle takie nieco bardziej fachowe, np. modulacja, tryt, paleontolog, palpitacja, Kasjopeja, itp.

4; bardzo trudne; i tam widać na wykresach, że tu są głównie nazwy własne, bo takich jest przecież bardzo dużo... geografia, naukowcy, politycy.

W zasadzie poziomy 1 i 2 są pospolity, czyli jest tego ponad 40 tyś. - same rzeczowniki!

1 użytkowników online, w tym zalogowanych: 0, gości: 1