Robię ranking języków programowania w oparciu o ogłoszenia rekrutacyjne.
Zanim zacznę wypełniać tabele, możecie luknąć czy to ma sens?
(jobs.name
to będą słowa kluczowe (języki programowania) np. java
, scala
itd.)
Robię ranking języków programowania w oparciu o ogłoszenia rekrutacyjne.
Zanim zacznę wypełniać tabele, możecie luknąć czy to ma sens?
(jobs.name
to będą słowa kluczowe (języki programowania) np. java
, scala
itd.)
doczepiłbym się jedynie nazw pól jobs.name ( bo koliduje mi z job_name_translated ) albo ogólnie założyłbym osobną tablicę **translacje **zamiast jobs_dictionary. .
translacje z polami: idTranslacji, languageCode, translation .. wówczas we wszystkich tabelach zamiast pola name dawałbym idTranslacji ... i wszystko było by wtedy "multikulti" a nie tylko tabela jobs.
Bo co jak co ale akurat nazwy języków programowania mało kiedy się tłumaczy w przeciwieństwie do nazw krajów, których Ty nie tłumaczysz. Zakładam, że użytkownik będzie miał wybrać kraj i język. Tak ?
No i ta tabela count_result po co jest? Przecież i tak każdy głos ankiety będziesz miał w run_info i będziesz mógł zawsze to zliczyć.
katakrowa napisał(a):
Bo co jak co ale akurat nazwy języków programowania mało kiedy się tłumaczy
będę szukał też np. (java deloper | programista java) stąd to tłumaczenie.
Zakładam, że użytkownik będzie miał wybrać kraj i język. Tak ?
tłumaczenie dodaję bardziej z myślą o scraperach, które uruchomię tak:
scala -jar job-count-scrapper.jar --config.file=argentina.xml
scala -jar job-count-scrapper.jar --config.file=brazil.xml
scala -jar job-count-scrapper.jar --config.file=israel.xml
scala -jar job-count-scrapper.jar --config.file=poland.xml
scala -jar job-count-scrapper.jar --config.file= ...
...
w argentina.xml będzie podana konfiguracja dla scrapowania argentyńskiej stronki i wartość country=ARG
, a w brazil.xml do brazylisjkiej i country=BR
.
job-scount-.scrapper.jar będzie zbierał dane po wszystkich słowach z tabeli jobs
, w zależności od wartości country
w wyszukiwarkę wpiszę przetłumaczone słowo.
np.
select
job_name_translated
from
jobs j join
jobs_dictionary d on j.id= d.jobs_id join
country c on c.id=d.country_id
where
c.name = 'ARG'
No i ta tabela count_result po co jest? Przecież i tak każdy głos ankiety będziesz miał w run_info i będziesz mógł zawsze to zliczyć.
faktycznie...
Mogę doradzić aby w tabelce country używać ISO standardu, iso code + name itp.
Ostatecznie zrobię chyba tak: