6 |
import java.util.Collections; |
import java.util.Collections; |
7 |
import java.util.Date; |
import java.util.Date; |
8 |
import java.util.HashMap; |
import java.util.HashMap; |
|
import java.util.HashSet; |
|
9 |
import java.util.List; |
import java.util.List; |
10 |
import java.util.Map; |
import java.util.Map; |
11 |
import java.util.Map.Entry; |
import java.util.Map.Entry; |
318 |
|
|
319 |
/* Mapper mellem db Row ID og adresse noden */ |
/* Mapper mellem db Row ID og adresse noden */ |
320 |
Map<Integer,Address> idAddressMap = new HashMap<Integer,Address>( alleAdresser.size() ); |
Map<Integer,Address> idAddressMap = new HashMap<Integer,Address>( alleAdresser.size() ); |
321 |
DeduplicateHelper<String> aliasHelper = new DeduplicateHelper<String>(); |
DeduplicateHelper<String> aliasHelper = new DeduplicateHelper<String>(400000); // Indeholder pt 379664 entries |
322 |
|
|
323 |
DeduplicateHelper<Short> shortHelper = new DeduplicateHelper<Short>(); |
DeduplicateHelper<Short> shortHelper = new DeduplicateHelper<Short>(); |
324 |
DeduplicateHelper<Integer> intHelper = new DeduplicateHelper<Integer>(); |
DeduplicateHelper<Integer> intHelper = new DeduplicateHelper<Integer>(); |
325 |
|
|
326 |
|
AliasGenerator aliasGenerator = new AliasGenerator(); |
327 |
|
|
328 |
|
|
329 |
for (Address a : alleAdresser) { |
for (Address a : alleAdresser) { |
330 |
idAddressMap.put(a.id, a); |
idAddressMap.put(a.id, a); |
346 |
|
|
347 |
gadeident = intHelper.getInstance( a.gadeid ); |
gadeident = intHelper.getInstance( a.gadeid ); |
348 |
|
|
349 |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
Set<String> aliaser = aliasGenerator.findVejAliaser(a.vejnavn); |
350 |
for(String alias : aliaser) { |
for(String alias : aliaser) { |
351 |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
352 |
vasketAlias = aliasHelper.getInstance(vasketAlias); |
vasketAlias = aliasHelper.getInstance(vasketAlias); |
371 |
|
|
372 |
litraList.put(a.husnrbogstav, a); |
litraList.put(a.husnrbogstav, a); |
373 |
} |
} |
374 |
|
|
375 |
|
aliasHelper = null; //frigiv hukommelse inden stage2 |
376 |
|
aliasGenerator = null; |
377 |
|
|
378 |
|
|
379 |
//////////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////////// |
380 |
long start2 = System.currentTimeMillis(); |
long start2 = System.currentTimeMillis(); |
648 |
return AddressUtils.injectIntoBk(targetAddress.koreliste, inject); |
return AddressUtils.injectIntoBk(targetAddress.koreliste, inject); |
649 |
} |
} |
650 |
|
|
|
private Set<String> findVejAliaser(String vejnavn) { |
|
|
vejnavn = vejnavn.toLowerCase(); |
|
|
HashSet<String> aliasSet = new HashSet<String>(); |
|
|
aliasSet.add(vejnavn); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("alle", "allé") ); |
|
|
aliasSet.add(vejnavn.replace("allé", "alle") ); |
|
|
|
|
|
|
|
|
// forkortelser |
|
|
aliasSet.add(vejnavn.replace("dronningens", "dr") ); |
|
|
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
|
|
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("dronning", "dr") ); |
|
|
aliasSet.add(vejnavn.replace("dr.", "dronning") ); |
|
|
aliasSet.add(vejnavn.replace("dr ", "dronning") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("kng", "kongen") ); |
|
|
aliasSet.add(vejnavn.replace("kongen", "kng") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
|
|
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("gl", "gammel") ); |
|
|
aliasSet.add(vejnavn.replace("gammel", "gl") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("gl", "gamle") ); |
|
|
aliasSet.add(vejnavn.replace("gamle", "gl") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("lille", "ll") ); |
|
|
aliasSet.add(vejnavn.replace("ll ", "lille") ); |
|
|
aliasSet.add(vejnavn.replace("ll.", "lille") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("store", "st") ); |
|
|
aliasSet.add(vejnavn.replace("st ", "store") ); |
|
|
aliasSet.add(vejnavn.replace("st.", "store") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
|
|
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
|
|
aliasSet.add(vejnavn.replace("sønder", "sdr") ); |
|
|
aliasSet.add(vejnavn.replace("sdr", "sønder") ); |
|
|
|
|
|
|
|
|
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
|
|
aliasSet.add(vejnavn.replace("nr", "nørre") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("nordre", "ndr") ); |
|
|
aliasSet.add(vejnavn.replace("ndr", "nordre") ); |
|
|
|
|
|
|
|
|
aliasSet.add(vejnavn.replace("vestre", "vester") ); |
|
|
aliasSet.add(vejnavn.replace("vester", "vestre") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("søndre", "sønder") ); |
|
|
aliasSet.add(vejnavn.replace("sønder", "søndre") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("østre", "øster") ); |
|
|
aliasSet.add(vejnavn.replace("øster", "østre") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("borgmester", "borgm") ); |
|
|
aliasSet.add(vejnavn.replace("borgm", "borgmester") ); |
|
|
|
|
|
|
|
|
aliasSet.add(vejnavn.replace("sankt", "skt") ); |
|
|
aliasSet.add(vejnavn.replace("sankt", "sct") ); |
|
|
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("skt", "sct") ); |
|
|
aliasSet.add(vejnavn.replace("sct", "skt") ); |
|
|
|
|
|
|
|
|
|
|
|
// fornavn forkortelser |
|
|
aliasSet.add(vejnavn.replace("john", "j") ); |
|
|
aliasSet.add(vejnavn.replace("thomas", "th") ); |
|
|
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
|
|
aliasSet.add(vejnavn.replace("frederik", "fr") ); |
|
|
aliasSet.add(vejnavn.replace("frederiks", "fr") ); |
|
|
|
|
|
|
|
|
aliasSet.add(vejnavn.replace("christian", "chr") ); |
|
|
aliasSet.add(vejnavn.replace("christians", "chr") ); |
|
|
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
|
|
aliasSet.add(vejnavn.replace("kristians", "kr") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("mylius", "myl") ); |
|
|
aliasSet.add(vejnavn.replace("myl", "mylius") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("ludvig", "ludv") ); |
|
|
aliasSet.add(vejnavn.replace("ludv", "ludvig") ); |
|
|
|
|
|
|
|
|
// alternative stavninger |
|
|
aliasSet.add(vejnavn.replace("peder", "peter") ); |
|
|
aliasSet.add(vejnavn.replace("peter", "peder") ); |
|
|
|
|
|
|
|
|
|
|
|
// Romertal |
|
|
aliasSet.add(vejnavn.replace("1", "i") ); |
|
|
aliasSet.add(vejnavn.replace("i", "1") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("2", "ii") ); |
|
|
aliasSet.add(vejnavn.replace("ii", "2") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("3", "iii") ); |
|
|
aliasSet.add(vejnavn.replace("iii", "3") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("4", "iv") ); |
|
|
aliasSet.add(vejnavn.replace("iv", "4") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("5", "v") ); |
|
|
aliasSet.add(vejnavn.replace("v", "5") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("6", "vi") ); |
|
|
aliasSet.add(vejnavn.replace("vi", "6") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("7", "vii") ); |
|
|
aliasSet.add(vejnavn.replace("vii", "7") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("8", "viii") ); |
|
|
aliasSet.add(vejnavn.replace("viii", "8") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("9", "ix") ); |
|
|
aliasSet.add(vejnavn.replace("ix", "9") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("10", "x") ); |
|
|
aliasSet.add(vejnavn.replace("x", "10") ); |
|
|
|
|
|
|
|
|
//alternative måder at stave vej/gade/alle |
|
|
aliasSet.add(vejnavn.replace("vej", "ve") ); |
|
|
aliasSet.add(vejnavn.replace("vej", "vj") ); |
|
|
aliasSet.add(vejnavn.replace("vej", "v") ); |
|
|
aliasSet.add(vejnavn.replace("vej", "vejen") ); |
|
|
aliasSet.add(vejnavn.replace("vejen", "vej") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("v", "vej") );//Vi kan have vejnavne i DB der bare slutter på v istedet for vej |
|
|
|
|
|
aliasSet.add(vejnavn.replace("alle", "all") ); |
|
|
aliasSet.add(vejnavn.replace("allé", "all") ); |
|
|
aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo |
|
|
aliasSet.add(vejnavn.replace("allé", "allú") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
|
|
aliasSet.add(vejnavn.replace("gade", "gde") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("plads", "pl") ); |
|
|
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("boulevard", "blvd") ); |
|
|
aliasSet.add(vejnavn.replace("blvd", "boulevard") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("boulevard", "boule") ); |
|
|
aliasSet.add(vejnavn.replace("boule", "boulevard") ); |
|
|
|
|
|
aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 |
|
|
aliasSet.add(vejnavn.replace("krbg", "kronborg") ); |
|
|
|
|
|
// Opbyg æøå varianter over alle fundne aliaser |
|
|
|
|
|
HashSet<String> variants = new HashSet<String>( aliasSet ); |
|
|
|
|
|
for (String vVejnavn : variants) { |
|
|
// danske tegn 1 |
|
|
aliasSet.add( vVejnavn.replace("æ", "ae") ); |
|
|
aliasSet.add( vVejnavn.replace("ø", "oe") ); |
|
|
aliasSet.add( vVejnavn.replace("å", "aa") ); |
|
|
aliasSet.add( vVejnavn.replace("ae", "æ") ); |
|
|
aliasSet.add( vVejnavn.replace("oe", "ø") ); |
|
|
aliasSet.add( vVejnavn.replace("aa", "å") ); |
|
|
|
|
|
//danske tegn 2 |
|
|
aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") ); |
|
|
aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") ); |
|
|
aliasSet.add( vVejnavn.replace("ø", "oe").replace("å", "aa") ); |
|
|
aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") ); |
|
|
aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") ); |
|
|
aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); |
|
|
|
|
|
//danske tegn 3 |
|
|
aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
|
|
aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
|
|
|
|
|
|
|
|
//udenlandsketegn |
|
|
aliasSet.add( vVejnavn.replace("u", "ü") ); |
|
|
aliasSet.add( vVejnavn.replace("ü", "u") ); |
|
|
|
|
|
aliasSet.add( vVejnavn.replace("ä", "æ") ); |
|
|
aliasSet.add( vVejnavn.replace("æ", "ä") ); |
|
|
|
|
|
aliasSet.add( vVejnavn.replace("ö", "ø") ); |
|
|
aliasSet.add( vVejnavn.replace("ø", "ö") ); |
|
|
} |
|
|
|
|
|
return aliasSet; |
|
|
} |
|
651 |
|
|
652 |
public Set<Short> getPostnumre() { |
public Set<Short> getPostnumre() { |
653 |
return new TreeSet<Short>( searchPostnrVejnavnGadeid.keySet() ); |
return new TreeSet<Short>( searchPostnrVejnavnGadeid.keySet() ); |