( bucko | 2013. 11. 25., h – 17:34 )

Programot ;)
Ez azért nem ilyen egyszerű. Nem elég, hogy a két rendszer önmagában konzisztens, de valószínűleg más-más elírások vannak rendszerenként.
Ezt úgy hívják adattisztítás.
- meg kell állapítani az egyezéseket -> kidobni
- a hasonlóságokat -> javítani
- eltéréseket -> javítani, hozzáadni

A javítások egy része automatizálható, a többi kézimunka.

Az a kérdés, hogy hány adatról van szó, és melyen a minőség, szótározottság.