--- dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2016/01/13 10:51:39 2803 +++ dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2016/01/20 21:13:08 2837 @@ -6,7 +6,6 @@ import java.util.Collections; import java.util.Date; import java.util.HashMap; -import java.util.HashSet; import java.util.List; import java.util.Map; import java.util.Map.Entry; @@ -35,10 +34,10 @@ public class AddressSearch { private Map> searchPostnrVejnavnGadeid; - private Map>> searchGadeidentAdresser; // Gadeident -> husnrumre -> litra + private Map>> searchGadeidentAdresser; // Gadeident -> husnrumre -> litra - - private List
alleAdresser; + private ArrayList
ikkeDaekkedeAdresser = new ArrayList
(60000); + private ArrayList
hundredePctAdresser = new ArrayList
(120000); private Map helperCache; @@ -67,15 +66,21 @@ public Address getAddressSafe(int gadeid, short husnr, String litra) throws Exception { - Map> gade = searchGadeidentAdresser.get(gadeid); + Map> gade = searchGadeidentAdresser.get(gadeid); if (gade == null) { throw new Exception("GadeID ikke fundet"); } - Map litraList = gade.get(husnr); + List
litraList = gade.get(husnr); - Address addr = litraList.get(litra); + Address addr = null; + for(Address a : litraList) { + if (a.husnrbogstav.equals(litra) ) { + addr = a; + break; + } + } if (addr == null) { throw new Exception("Adresse ikke ikke fundet"); @@ -182,25 +187,26 @@ result.gadeident = gadeident; - Map> gade = searchGadeidentAdresser.get(gadeident); + Map> gade = searchGadeidentAdresser.get(gadeident); if (gade == null) { //Denne søgning må ikke fejle result.status = Status.ERROR_INTERNAL; return result; } + //Kunne evt klares med Iterables.get fra Guava/Collections - Address firstAddress = gade.values().iterator().next().values().iterator().next(); //Første husnr -> første litra + Address firstAddress = gade.values().iterator().next().get(0); //Første husnr -> første litra result.vej = firstAddress.vejnavn; short husnrSearch = Short.parseShort(result.splitResult.husnr ); - Map litraList = gade.get(husnrSearch); + List
litraList = gade.get(husnrSearch); if (litraList == null) { //Husnr ikke fundet if (naermesteHusnr) { - TreeMap> gadeTreeMap = (TreeMap>) gade; + TreeMap> gadeTreeMap = (TreeMap>) gade; result.anvendtHusnr = NearestShortTreeMap.getNearestKey(husnrSearch, gadeTreeMap); result.nearestHusnr = true; @@ -213,12 +219,18 @@ } } - Address addr = litraList.get( result.splitResult.litra ); + Address addr = null; + for(Address a : litraList) { + if ( a.husnrbogstav.equals( result.splitResult.litra ) ) { + addr = a; + break; + } + } if (addr == null) { //litra ikke fundet - if (config.nearestLitra == true) { + if (config.nearestLitra == true || naermesteHusnr == true) { result.nearestLitra = true; - addr = litraList.values().iterator().next(); + addr = litraList.get(0); } else { //husnr fundet men litra blev ikke fundet result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; @@ -308,22 +320,28 @@ public void buildSearchStructures() throws SQLException{ searchPostnrVejnavnGadeid = new HashMap>(); - searchGadeidentAdresser = new HashMap>>(); + searchGadeidentAdresser = new HashMap>>(); helperCache = new ConcurrentHashMap(); + // ////////////////////// + // Start stage1 + long start1 = System.currentTimeMillis(); System.out.println("Build -- stage 1"); - alleAdresser = db.getAllAdresses(); + List
alleAdresser = db.getAllAdresses(); - /* Mapper mellem db Row ID og adresse noden */ + /* Mapper mellem db Row ID og adresse noden - skal bruges i stage3*/ Map idAddressMap = new HashMap( alleAdresser.size() ); - DeduplicateHelper aliasHelper = new DeduplicateHelper(); + DeduplicateHelper shortHelper = new DeduplicateHelper(); DeduplicateHelper intHelper = new DeduplicateHelper(); + AliasGenerator aliasGenerator = new AliasGenerator(); + + ArrayList> litraListCache = new ArrayList>(); for (Address a : alleAdresser) { idAddressMap.put(a.id, a); @@ -345,31 +363,40 @@ gadeident = intHelper.getInstance( a.gadeid ); - Set aliaser = findVejAliaser(a.vejnavn); - for(String alias : aliaser) { - String vasketAlias = AddressUtils.vaskVejnavn(alias); - vasketAlias = aliasHelper.getInstance(vasketAlias); - - postnrVeje.put(vasketAlias, gadeident); + Set aliaser = aliasGenerator.findVejAliaser(a.vejnavn); + for(String alias : aliaser) { + postnrVeje.put(alias, gadeident); } } - Map> gade = searchGadeidentAdresser.get(gadeident); + Map> gade = searchGadeidentAdresser.get(gadeident); if (gade == null) { - gade = new TreeMap>(); + gade = new TreeMap >(); searchGadeidentAdresser.put(gadeident, gade); } - Map litraList = gade.get(a.husnr); + List
litraList = gade.get(a.husnr); if (litraList == null) { - litraList = new HashMap(); + litraList = new ArrayList
(); gade.put(a.husnr, litraList); + + litraListCache.add( (ArrayList
) litraList); } - - litraList.put(a.husnrbogstav, a); + litraList.add(a); } + + for (ArrayList
list: litraListCache) { + list.trimToSize(); + } + + + litraListCache.clear(); //frigiv hukommelse inden stage2 + aliasGenerator.clear(); + shortHelper.clear(); + intHelper.clear(); + //////////////////////////////////////////////////////////////////////////////////////// long start2 = System.currentTimeMillis(); @@ -405,6 +432,8 @@ } System.out.println("Anvendte " + vaskCount + " aliaser fra databasen"); + aliasList.clear();//cleanup inden stage3 + //////////////////////////////////////////////////////////////////////////////////////// long start3 = System.currentTimeMillis(); @@ -447,21 +476,21 @@ boolean covered = false; if (targetAddress.distributor.equals("DAO")) { - orgAddress.rute = calculateExtendedDaoRoute(eb,orgAddress,targetAddress); - orgAddress.rute = ruteHelper.getInstance(orgAddress.rute); + orgAddress.ruteMandag = calculateExtendedDaoRoute(eb,orgAddress,targetAddress); + orgAddress.ruteMandag = ruteHelper.getInstance(orgAddress.ruteMandag); - if (orgAddress.rute != null) { - orgAddress.koreliste = targetAddress.koreliste; + if (orgAddress.ruteMandag != null) { + orgAddress.korelisteMandag = targetAddress.korelisteMandag; covered = true; } } if (targetAddress.distributor.equals("BK")) { - orgAddress.koreliste = calculateExtendedBkKoreliste(eb,orgAddress,targetAddress); - orgAddress.koreliste = korelisteHelper.getInstance(orgAddress.koreliste); + orgAddress.korelisteMandag = calculateExtendedBkKoreliste(eb,orgAddress,targetAddress); + orgAddress.korelisteMandag = korelisteHelper.getInstance(orgAddress.korelisteMandag); - if (orgAddress.koreliste != null) { - orgAddress.rute = targetAddress.rute; + if (orgAddress.korelisteMandag != null) { + orgAddress.ruteMandag = targetAddress.ruteMandag; covered = true; } } @@ -480,8 +509,10 @@ } } - // nu skal vi ikke bruge idAddressMap længere + // cleanup inden stage 4 idAddressMap = null; + ruteHelper = null; + korelisteHelper = null; ////////////////////////////////////////////////////////////////////////////////////// long start4 = System.currentTimeMillis(); @@ -505,8 +536,8 @@ } addr.daekningsType = DaekningsType.DAEKNING_100PCT; - addr.rute = bean.rute; - addr.koreliste = bean.koreliste; + addr.ruteMandag = bean.rute; + addr.korelisteMandag = bean.koreliste; addr.dbkBane = bean.dbkBane; addr.distributor = bean.distributor; } @@ -525,14 +556,21 @@ stats.extendedCount++; break; case DAEKNING_100PCT: + hundredePctAdresser.add(addr); stats.hundredePctCount++; break; default: + ikkeDaekkedeAdresser.add(addr); stats.ikkeDaekketCount++; } } stats.totalCount = alleAdresser.size(); + ikkeDaekkedeAdresser.trimToSize(); + hundredePctAdresser.trimToSize(); + Collections.sort( ikkeDaekkedeAdresser ); //Bruger Comparable interfacet + Collections.sort( hundredePctAdresser ); + stats.elapsed = stop-start1; stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); @@ -559,13 +597,12 @@ public void clear() { searchPostnrVejnavnGadeid.clear(); searchGadeidentAdresser.clear(); - alleAdresser.clear(); helperCache.clear(); } private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { - if (targetAddress.rute == null) { //hvis targetAdress.rute er null så er adressen ikke dækket alligevel + if (targetAddress.ruteMandag == null) { //hvis targetAdress.rute er null så er adressen ikke dækket alligevel return null; } @@ -573,35 +610,35 @@ switch( eb.transport) { case "cykel": if (eb.afstand < 0.151) { - return "." + targetAddress.rute; + return "." + targetAddress.ruteMandag; } else if (eb.afstand < 0.501) { - return ".." + targetAddress.rute; + return ".." + targetAddress.ruteMandag; } else if (eb.afstand < 0.701) { - return "..." + targetAddress.rute; + return "..." + targetAddress.ruteMandag; } else if (eb.afstand < 1.001) { - return "...." + targetAddress.rute; + return "...." + targetAddress.ruteMandag; } break; case "scooter": if (eb.afstand < 0.151) { - return "." + targetAddress.rute; + return "." + targetAddress.ruteMandag; } else if (eb.afstand < 0.801) { - return ".." + targetAddress.rute; + return ".." + targetAddress.ruteMandag; } else if (eb.afstand < 1.201) { - return "..." + targetAddress.rute; + return "..." + targetAddress.ruteMandag; } else if (eb.afstand < 2.101) { - return "...." + targetAddress.rute; + return "...." + targetAddress.ruteMandag; } break; case "bil": if (eb.afstand < 0.151) { - return "." + targetAddress.rute; + return "." + targetAddress.ruteMandag; } else if (eb.afstand < 1.001) { - return ".." + targetAddress.rute; + return ".." + targetAddress.ruteMandag; } else if (eb.afstand < 1.601) { - return "..." + targetAddress.rute; + return "..." + targetAddress.ruteMandag; } else if (eb.afstand < 2.601) { - return "...." + targetAddress.rute; + return "...." + targetAddress.ruteMandag; } break; default: @@ -611,25 +648,11 @@ } public List
getNonCoveredAddresses() { - List
result = new ArrayList
(60000); - for (Address a : alleAdresser) { - if ( a.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) { - result.add(a); - } - } - Collections.sort(result ); - return result; + return ikkeDaekkedeAdresser; } public List
get100PctAddresses() { - List
result = new ArrayList
(120000); - for (Address a : alleAdresser) { - if ( a.daekningsType == DaekningsType.DAEKNING_100PCT) { - result.add(a); - } - } - Collections.sort(result ); - return result; + return hundredePctAdresser; } /////////////////////////////////////////////////////////// @@ -640,208 +663,9 @@ } else { inject = ".."; } - return AddressUtils.injectIntoBk(targetAddress.koreliste, inject); + return AddressUtils.injectIntoBk(targetAddress.korelisteMandag, inject); } - private Set findVejAliaser(String vejnavn) { - vejnavn = vejnavn.toLowerCase(); - HashSet aliasSet = new HashSet(); - aliasSet.add(vejnavn); - - aliasSet.add(vejnavn.replace("alle", "allé") ); - aliasSet.add(vejnavn.replace("allé", "alle") ); - - - // forkortelser - aliasSet.add(vejnavn.replace("dronningens", "dr") ); - aliasSet.add(vejnavn.replace("dr.", "dronningens") ); - aliasSet.add(vejnavn.replace("dr ", "dronningens") ); - - aliasSet.add(vejnavn.replace("dronning", "dr") ); - aliasSet.add(vejnavn.replace("dr.", "dronning") ); - aliasSet.add(vejnavn.replace("dr ", "dronning") ); - - aliasSet.add(vejnavn.replace("kng", "kongen") ); - aliasSet.add(vejnavn.replace("kongen", "kng") ); - - aliasSet.add(vejnavn.replace("kvt", "kvarter") ); - aliasSet.add(vejnavn.replace("kvarter", "kvt") ); - - aliasSet.add(vejnavn.replace("gl", "gammel") ); - aliasSet.add(vejnavn.replace("gammel", "gl") ); - - aliasSet.add(vejnavn.replace("gl", "gamle") ); - aliasSet.add(vejnavn.replace("gamle", "gl") ); - - aliasSet.add(vejnavn.replace("lille", "ll") ); - aliasSet.add(vejnavn.replace("ll ", "lille") ); - aliasSet.add(vejnavn.replace("ll.", "lille") ); - - aliasSet.add(vejnavn.replace("store", "st") ); - aliasSet.add(vejnavn.replace("st ", "store") ); - aliasSet.add(vejnavn.replace("st.", "store") ); - - aliasSet.add(vejnavn.replace("søndre", "sdr") ); - aliasSet.add(vejnavn.replace("sdr", "søndre") ); - aliasSet.add(vejnavn.replace("sønder", "sdr") ); - aliasSet.add(vejnavn.replace("sdr", "sønder") ); - - - aliasSet.add(vejnavn.replace("nørre", "nr") ); - aliasSet.add(vejnavn.replace("nr", "nørre") ); - - aliasSet.add(vejnavn.replace("nordre", "ndr") ); - aliasSet.add(vejnavn.replace("ndr", "nordre") ); - - - aliasSet.add(vejnavn.replace("vestre", "vester") ); - aliasSet.add(vejnavn.replace("vester", "vestre") ); - - aliasSet.add(vejnavn.replace("søndre", "sønder") ); - aliasSet.add(vejnavn.replace("sønder", "søndre") ); - - aliasSet.add(vejnavn.replace("østre", "øster") ); - aliasSet.add(vejnavn.replace("øster", "østre") ); - - aliasSet.add(vejnavn.replace("borgmester", "borgm") ); - aliasSet.add(vejnavn.replace("borgm", "borgmester") ); - - - aliasSet.add(vejnavn.replace("sankt", "skt") ); - aliasSet.add(vejnavn.replace("sankt", "sct") ); - aliasSet.add(vejnavn.replace("skt", "sankt") ); - - aliasSet.add(vejnavn.replace("skt", "sct") ); - aliasSet.add(vejnavn.replace("sct", "skt") ); - - - - // fornavn forkortelser - aliasSet.add(vejnavn.replace("john", "j") ); - aliasSet.add(vejnavn.replace("thomas", "th") ); - aliasSet.add(vejnavn.replace("thorvald", "th") ); - aliasSet.add(vejnavn.replace("frederik", "fr") ); - aliasSet.add(vejnavn.replace("frederiks", "fr") ); - - - aliasSet.add(vejnavn.replace("christian", "chr") ); - aliasSet.add(vejnavn.replace("christians", "chr") ); - aliasSet.add(vejnavn.replace("kristian", "kr") ); - aliasSet.add(vejnavn.replace("kristians", "kr") ); - - aliasSet.add(vejnavn.replace("mylius", "myl") ); - aliasSet.add(vejnavn.replace("myl", "mylius") ); - - aliasSet.add(vejnavn.replace("ludvig", "ludv") ); - aliasSet.add(vejnavn.replace("ludv", "ludvig") ); - - - // alternative stavninger - aliasSet.add(vejnavn.replace("peder", "peter") ); - aliasSet.add(vejnavn.replace("peter", "peder") ); - - - - // Romertal - aliasSet.add(vejnavn.replace("1", "i") ); - aliasSet.add(vejnavn.replace("i", "1") ); - - aliasSet.add(vejnavn.replace("2", "ii") ); - aliasSet.add(vejnavn.replace("ii", "2") ); - - aliasSet.add(vejnavn.replace("3", "iii") ); - aliasSet.add(vejnavn.replace("iii", "3") ); - - aliasSet.add(vejnavn.replace("4", "iv") ); - aliasSet.add(vejnavn.replace("iv", "4") ); - - aliasSet.add(vejnavn.replace("5", "v") ); - aliasSet.add(vejnavn.replace("v", "5") ); - - aliasSet.add(vejnavn.replace("6", "vi") ); - aliasSet.add(vejnavn.replace("vi", "6") ); - - aliasSet.add(vejnavn.replace("7", "vii") ); - aliasSet.add(vejnavn.replace("vii", "7") ); - - aliasSet.add(vejnavn.replace("8", "viii") ); - aliasSet.add(vejnavn.replace("viii", "8") ); - - aliasSet.add(vejnavn.replace("9", "ix") ); - aliasSet.add(vejnavn.replace("ix", "9") ); - - aliasSet.add(vejnavn.replace("10", "x") ); - aliasSet.add(vejnavn.replace("x", "10") ); - - - //alternative måder at stave vej/gade/alle - aliasSet.add(vejnavn.replace("vej", "ve") ); - aliasSet.add(vejnavn.replace("vej", "vj") ); - aliasSet.add(vejnavn.replace("vej", "v") ); - aliasSet.add(vejnavn.replace("vej", "vejen") ); - aliasSet.add(vejnavn.replace("vejen", "vej") ); - - aliasSet.add(vejnavn.replace("v", "vej") );//Vi kan have vejnavne i DB der bare slutter på v istedet for vej - - aliasSet.add(vejnavn.replace("alle", "all") ); - aliasSet.add(vejnavn.replace("allé", "all") ); - aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo - aliasSet.add(vejnavn.replace("allé", "allú") ); - - aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo - aliasSet.add(vejnavn.replace("gade", "gde") ); - - aliasSet.add(vejnavn.replace("plads", "pl") ); - aliasSet.add(vejnavn.replace("vænget", "vænge") ); - - aliasSet.add(vejnavn.replace("boulevard", "blvd") ); - aliasSet.add(vejnavn.replace("blvd", "boulevard") ); - - aliasSet.add(vejnavn.replace("boulevard", "boule") ); - aliasSet.add(vejnavn.replace("boule", "boulevard") ); - - aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 - aliasSet.add(vejnavn.replace("krbg", "kronborg") ); - - // Opbyg æøå varianter over alle fundne aliaser - - HashSet variants = new HashSet( aliasSet ); - - for (String vVejnavn : variants) { - // danske tegn 1 - aliasSet.add( vVejnavn.replace("æ", "ae") ); - aliasSet.add( vVejnavn.replace("ø", "oe") ); - aliasSet.add( vVejnavn.replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ae", "æ") ); - aliasSet.add( vVejnavn.replace("oe", "ø") ); - aliasSet.add( vVejnavn.replace("aa", "å") ); - - //danske tegn 2 - aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") ); - aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ø", "oe").replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") ); - aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") ); - aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); - - //danske tegn 3 - aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); - - - //udenlandsketegn - aliasSet.add( vVejnavn.replace("u", "ü") ); - aliasSet.add( vVejnavn.replace("ü", "u") ); - - aliasSet.add( vVejnavn.replace("ä", "æ") ); - aliasSet.add( vVejnavn.replace("æ", "ä") ); - - aliasSet.add( vVejnavn.replace("ö", "ø") ); - aliasSet.add( vVejnavn.replace("ø", "ö") ); - } - - return aliasSet; - } public Set getPostnumre() { return new TreeSet( searchPostnrVejnavnGadeid.keySet() ); @@ -857,11 +681,11 @@ public Set getHusnumre(int gadeid) { - Map> gade = searchGadeidentAdresser.get(gadeid); + Map> gade = searchGadeidentAdresser.get(gadeid); Set set = new TreeSet( new NaturalOrderComparator() ); - for(Map litraList : gade.values()) { - for (Address a: litraList.values()) { + for(List
litraList : gade.values()) { + for (Address a: litraList) { set.add( a.husnr + a.husnrbogstav ); } } @@ -873,9 +697,16 @@ short husnr = Short.parseShort( husnrStr.replaceAll("[^\\d]","") ); String litra = husnrStr.replaceAll("\\d", ""); - Map> gade = searchGadeidentAdresser.get(gadeid); - Map litraList = gade.get(husnr); - return litraList.get(litra); + Map> gade = searchGadeidentAdresser.get(gadeid); + List
litraList = gade.get(husnr); + + for(Address addr : litraList) { + if (addr.husnrbogstav.equals(litra)) { + return addr; + } + } + + return null; }