Łączenie left join z dwoma warunkami

0

Witajcie,
mam do połączenia dwie tabele. Jedna zawiera m.in. imię, nazwisko oraz numer klienta i jego dane osobowe (nazwijmy ją "dane"), druga - również pola imię, nazwisko, numer klienta, oraz kilka innych kolumn (nazwijmy ją "punkty").
Problem polega na tym, że o ile w tabeli dane wszystkie wartości są prawidłowe, o tyle w "punktach" bywa tak, że w danym rekordzie jest albo tylko imię i nazwisko (bez nr klienta), albo odwrotnie sam nr klienta - bez imienia i nazwiska.
Czyli wygląda to powiedzmy tak:
tabela dane

nr klienta imie nazwisko adres
1 adam nowak uliczna
2 arkadiusz nowak piaskowa
3 andrzej andrzejewski błotna

tabela punkty

nr klienta imie nazwisko punkty
1 5
arkadiusz nowak 20
3 andrzej andrzejewski 40
A ja muszę je połączyć tak, by wyświetlały się wszystkie rekordy tabeli dane, a do tego dołączone były odpowiednie rekordy tabeli punkty. Czyli efektem końcowym ma być coś takiego:
nr klienta imie nazwisko adres
---------------- ---------------- ---------------- ----------------
1 adam nowak uliczna
2 arkadiusz nowak piaskowa
3 andrzej andrzejewski błotna

Zakładałem, że zrobię to left joinem, a po wybraniu warunku łączenia dopiszę sobie "or" i będzie cacy. Tymczasem to nie działa, bo nie mogę wybrać nr klienta albo imienia albo nazwiska - musi to być numer klienta albo (imię oraz nazwisko). Podpowiecie proszę jak to ugryźć? Jestem noobem w tej dziedzinie, więc bardzo proszę łopatologicznie :) Z góry dzięki
Maciej

0
LEFT JOIN punkty ON (dane.nr_klienta = punkty.nr_klienta OR (dane.imie = punkty.imie AND dane.nazwisko = punkty.nazwisko))

Coś takiego ?

Edit:
Jeżeli chodzi o wyświetlanie danych to możesz też zakombinować z funkcją NVL (w Oracle), inne bazy mają odpowiedniki (chyba IFNULL, ISNULL etc).
Czyli zakładając że imię masz w dane albo w punkty i chcesz wyświetlić z dowolnej tabeli to tak:

SELECT NVL(dane.imie, punkty.imie) AS imie ... itd ...

Wtedy jeżeli dane.imie jest null to weźmie punkty.imie, a jak not null to weźmie dane.imie.

0

Moim zdaniem ten warunek dodatkowy w JOIN na imie i nazwisko nie zadziała. Jeśli rekordy są puste to co połączy? Skoro bierzemy imię i nazwisko a w tabeli punkty są to kolumny puste dla rekordu 1 to nie ma sensu ten dodatkowy warunek.
Natomiast drugie rozwiązanie z ISNULL ma sens, ale tylko w sytuacji kiedy łączysz tabele za pomocą nr klienta. Wtedy połączyć pusty rekord w tabeli punkty z danymi bo nr klienta jest 1 w obu tabelach. Wtedy w SELECT zastosuj funkcje systemową ISNULL, ewentualnie COALESCE na zasadzie:

SELECT COALESCE (dane.Imie,punkty.Imie,'Brak danych'), COALESCE (dane.Nazwisko,punkty.Nazwisko,'Brak danych') FROM .... 

Wtedy jeśli w obu tabelach będą puste kolumny to wyświetli Brak danych.

0

Dzięki za podpowiedzi.
Myślałem właśnie o warunku "or" ale okazuje się, że to chyba nie działa prawidłowo - zapytanie kręci przez parę minut bez wyników (więcej nie miałem siły czekać ;) ) . Baza jest spora (prawie sto tysięcy rekordów), może to dlatego?
Warunki ifnull się nie sprawdzą - okazuje się, że niektóre rekordy w bazie "punkty" nie są puste, a zawierają jakieś bzdury (np. "xxx" w numerze klienta albo "nieznane" w nazwisku). Do tego rekordy są czasem wprowadzone dwa, trzy razy..
To zapytanie musiałoby koniecznie łączyć najpierw przy pomocy numeru klienta, a gdy numer klienta jest różny - porównać imię i nazwisko, musiałoby być sprawdzone czy te komórki są identyczne żeby nie dodawać do nowej tabeli idiotyzmów.. jedyne na co wpadłem, to left join za pomocą porównania przez numer klienta, dalej kolejny left join połączony przez imię i nazwisko. Teoretycznie te rekordy które będą puste przy pierwszym warunku (bo nie połączy tabel, więc wklei null), będą wypełnione przy drugim i odwrotnie- wtedy zostaje tylko w select na samej górze wybrać case i każdą kolumnę oddzielnie pobierać z jednej albo drugiej tabeli właśnie przez sprawdzenie czy nie jest pusta. Ale to jest tak naokoło droga, że dobry programista by się pewnie popłakał jakby to zobaczył :) Już nie mówiąc o tym, że jak za rok będę musiał wyciągnąć jakieś kolejne dane, to jest cała masa roboty..jeśli macie pomysł jak to zrobić szybciej, to będę wdzięczny :)

0

OK, więc tak:

To co Ci podałem wiąże najpierw po nr klienta, a dopiero potem po imie+nazwisko, tak działa OR tj. do prawdy w pierwszym warunku od lewej.
Zdublowane rekordy.... niestety tak jest w przypadku łączenia po imie+nazwisko, możesz mieć kilka różnych osób o tych samych danych, jeżeli chodzi o zdublowane rekordy (zakładamy, że to te same osoby, a Ty chcesz pobrać pierwszy rekord) to możesz sobie w mojej ocenie poradzić funkcjami analitycznymi, tj. przypisać rank do każdej pozycji w ramach tego samego imienia + nazwiska w punkcie, a na końcu zrobić zapytanie z Twojego zapytania SELECT * FROM (tutaj_twój_select) WHERE rank = 1. Oczywiście możesz stracić część danych, najlepiej jak zobaczysz co to u Ciebie da. Powodzenia !

Zawsze możesz też posadzić kogoś, żeby to posprzątał ;)
Niestety w bazie danych jest syf, bywa.

0

Jeśli możemy założyć, że albo mamy podany [nr klienta] albo imię i nazwisko to rozwiązanie może wyglądać tak:

SELECT d.*,p.punkty
FROM dane d
JOIN punkty p ON p.[nr klienta]=d.[nr klienta] AND p.imie IS NULL
UNION ALL
SELECT d.*,p.punkty
FROM dane d
JOIN punkty p ON p.[nr klienta]=d.[nr klienta] AND p.imie IS NOT NULL
UNION ALL
SELECT d.*,p.punkty
FROM dane d
JOIN punkty p ON p.imie=d.imie AND p.nazwisko=d.nazwisko AND p.[nr klienta] IS NULL

Jeśli wydajność powyższego przy tej ilości jest słaba (choć nie powinna) to pytanie czy są tam założone jakieś indeksy i czy możesz je modyfikować jeśli istnieją albo dołożyć jeśli nie istnieją.

1

Napisałem krótki artykuł na temat różnych typów złączeń.
Jak działa JOIN w SQL Server

0

select
d.nr_klienta,
d.imie,
d.adres,
p.punkty
from
dane d
left outer join
punkty p on
(p.nr_klijenta = p.nr_klienta)or
((p.imie = d.imie)and(d.nazwisko = p.nazwisko))
tylko może się trafić osoba o takim samym numerze ID_klienta ale różnych innych danych lub odwrotnie

1 użytkowników online, w tym zalogowanych: 0, gości: 1