--- dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2015/11/26 12:50:05 2784 +++ dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2016/01/15 08:06:46 2816 @@ -6,7 +6,6 @@ import java.util.Collections; import java.util.Date; import java.util.HashMap; -import java.util.HashSet; import java.util.List; import java.util.Map; import java.util.Map.Entry; @@ -30,6 +29,7 @@ import dk.daoas.daoadresseservice.util.DaoUtils; import dk.daoas.daoadresseservice.util.DeduplicateHelper; import dk.daoas.daoadresseservice.util.NaturalOrderComparator; +import dk.daoas.daoadresseservice.util.NearestShortTreeMap; public class AddressSearch { @@ -83,8 +83,13 @@ return addr; } - + public SearchResult search(String postnrStr, String adresse) { + return search(postnrStr, adresse, false); + } + + + public SearchResult search(String postnrStr, String adresse, boolean naermesteHusnr) { postnrStr = postnrStr.trim(); adresse = adresse.trim(); @@ -192,14 +197,25 @@ if (litraList == null) { //Husnr ikke fundet - result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; - return result; + + if (naermesteHusnr) { + TreeMap> gadeTreeMap = (TreeMap>) gade; + result.anvendtHusnr = NearestShortTreeMap.getNearestKey(husnrSearch, gadeTreeMap); + + result.nearestHusnr = true; + litraList = gade.get(result.anvendtHusnr); + + + } else { + result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; + return result; + } } Address addr = litraList.get( result.splitResult.litra ); - if (addr == null) { - if (config.nearestLitra == true) { + if (addr == null) { //litra ikke fundet + if (config.nearestLitra == true || naermesteHusnr == true) { result.nearestLitra = true; addr = litraList.values().iterator().next(); } else { @@ -248,7 +264,7 @@ } if (gadeident == null) { - String vej = levenshteinHelper.proposeStreetName(request, result); + String vej = metaphoneHelper.proposeStreetName(request, result); if (vej != null) { gadeident = request.streetNames.get(vej); } @@ -294,6 +310,9 @@ searchGadeidentAdresser = new HashMap>>(); helperCache = new ConcurrentHashMap(); + // ////////////////////// + // Start stage1 + long start1 = System.currentTimeMillis(); System.out.println("Build -- stage 1"); @@ -302,16 +321,24 @@ /* Mapper mellem db Row ID og adresse noden */ Map idAddressMap = new HashMap( alleAdresser.size() ); - DeduplicateHelper aliasHelper = new DeduplicateHelper(); + + + DeduplicateHelper shortHelper = new DeduplicateHelper(); + DeduplicateHelper intHelper = new DeduplicateHelper(); + + AliasGenerator aliasGenerator = new AliasGenerator(); + for (Address a : alleAdresser) { idAddressMap.put(a.id, a); - Map postnrVeje = searchPostnrVejnavnGadeid.get(a.postnr); + Short postnr = shortHelper.getInstance(a.postnr); + + Map postnrVeje = searchPostnrVejnavnGadeid.get(postnr); if (postnrVeje == null) { - postnrVeje = new ConcurrentHashMap(); - searchPostnrVejnavnGadeid.put(a.postnr, postnrVeje); + postnrVeje = new HashMap(10240); //lige nu indeholder den største 9500 entries + searchPostnrVejnavnGadeid.put(postnr, postnrVeje); } @@ -320,17 +347,16 @@ if (gadeident == null) { //postnrVeje.put(vasketVejnavn, a.gadeid); - gadeident = a.gadeid; + gadeident = intHelper.getInstance( a.gadeid ); + + Set aliaser = aliasGenerator.findVejAliaser(a.vejnavn); + for(String alias : aliaser) { + postnrVeje.put(alias, gadeident); + } - Set aliaser = findVejAliaser(a.vejnavn); - for(String alias : aliaser) { - String vasketAlias = AddressUtils.vaskVejnavn(alias); - vasketAlias = aliasHelper.getInstance(vasketAlias); - - postnrVeje.put(vasketAlias, gadeident); - } } + Map> gade = searchGadeidentAdresser.get(gadeident); if (gade == null) { gade = new TreeMap>(); @@ -346,6 +372,15 @@ litraList.put(a.husnrbogstav, a); } + + aliasGenerator.clear(); //frigiv hukommelse inden stage2 + aliasGenerator = null; + shortHelper.clear(); + shortHelper = null; + intHelper.clear(); + intHelper = null; + + //////////////////////////////////////////////////////////////////////////////////////// long start2 = System.currentTimeMillis(); System.out.println("Build, stage1 elapsed: " + (start2-start1) ); @@ -618,206 +653,6 @@ return AddressUtils.injectIntoBk(targetAddress.koreliste, inject); } - private Set findVejAliaser(String vejnavn) { - vejnavn = vejnavn.toLowerCase(); - HashSet aliasSet = new HashSet(); - aliasSet.add(vejnavn); - - aliasSet.add(vejnavn.replace("alle", "allé") ); - aliasSet.add(vejnavn.replace("allé", "alle") ); - - - // forkortelser - aliasSet.add(vejnavn.replace("dronningens", "dr") ); - aliasSet.add(vejnavn.replace("dr.", "dronningens") ); - aliasSet.add(vejnavn.replace("dr ", "dronningens") ); - - aliasSet.add(vejnavn.replace("dronning", "dr") ); - aliasSet.add(vejnavn.replace("dr.", "dronning") ); - aliasSet.add(vejnavn.replace("dr ", "dronning") ); - - aliasSet.add(vejnavn.replace("kng", "kongen") ); - aliasSet.add(vejnavn.replace("kongen", "kng") ); - - aliasSet.add(vejnavn.replace("kvt", "kvarter") ); - aliasSet.add(vejnavn.replace("kvarter", "kvt") ); - - aliasSet.add(vejnavn.replace("gl", "gammel") ); - aliasSet.add(vejnavn.replace("gammel", "gl") ); - - aliasSet.add(vejnavn.replace("gl", "gamle") ); - aliasSet.add(vejnavn.replace("gamle", "gl") ); - - aliasSet.add(vejnavn.replace("lille", "ll") ); - aliasSet.add(vejnavn.replace("ll ", "lille") ); - aliasSet.add(vejnavn.replace("ll.", "lille") ); - - aliasSet.add(vejnavn.replace("store", "st") ); - aliasSet.add(vejnavn.replace("st ", "store") ); - aliasSet.add(vejnavn.replace("st.", "store") ); - - aliasSet.add(vejnavn.replace("søndre", "sdr") ); - aliasSet.add(vejnavn.replace("sdr", "søndre") ); - aliasSet.add(vejnavn.replace("sønder", "sdr") ); - aliasSet.add(vejnavn.replace("sdr", "sønder") ); - - - aliasSet.add(vejnavn.replace("nørre", "nr") ); - aliasSet.add(vejnavn.replace("nr", "nørre") ); - - aliasSet.add(vejnavn.replace("nordre", "ndr") ); - aliasSet.add(vejnavn.replace("ndr", "nordre") ); - - - aliasSet.add(vejnavn.replace("vestre", "vester") ); - aliasSet.add(vejnavn.replace("vester", "vestre") ); - - aliasSet.add(vejnavn.replace("søndre", "sønder") ); - aliasSet.add(vejnavn.replace("sønder", "søndre") ); - - aliasSet.add(vejnavn.replace("østre", "øster") ); - aliasSet.add(vejnavn.replace("øster", "østre") ); - - aliasSet.add(vejnavn.replace("borgmester", "borgm") ); - aliasSet.add(vejnavn.replace("borgm", "borgmester") ); - - - aliasSet.add(vejnavn.replace("sankt", "skt") ); - aliasSet.add(vejnavn.replace("sankt", "sct") ); - aliasSet.add(vejnavn.replace("skt", "sankt") ); - - aliasSet.add(vejnavn.replace("skt", "sct") ); - aliasSet.add(vejnavn.replace("sct", "skt") ); - - - - // fornavn forkortelser - aliasSet.add(vejnavn.replace("john", "j") ); - aliasSet.add(vejnavn.replace("thomas", "th") ); - aliasSet.add(vejnavn.replace("thorvald", "th") ); - aliasSet.add(vejnavn.replace("frederik", "fr") ); - aliasSet.add(vejnavn.replace("frederiks", "fr") ); - - - aliasSet.add(vejnavn.replace("christian", "chr") ); - aliasSet.add(vejnavn.replace("christians", "chr") ); - aliasSet.add(vejnavn.replace("kristian", "kr") ); - aliasSet.add(vejnavn.replace("kristians", "kr") ); - - aliasSet.add(vejnavn.replace("mylius", "myl") ); - aliasSet.add(vejnavn.replace("myl", "mylius") ); - - aliasSet.add(vejnavn.replace("ludvig", "ludv") ); - aliasSet.add(vejnavn.replace("ludv", "ludvig") ); - - - // alternative stavninger - aliasSet.add(vejnavn.replace("peder", "peter") ); - aliasSet.add(vejnavn.replace("peter", "peder") ); - - - - // Romertal - aliasSet.add(vejnavn.replace("1", "i") ); - aliasSet.add(vejnavn.replace("i", "1") ); - - aliasSet.add(vejnavn.replace("2", "ii") ); - aliasSet.add(vejnavn.replace("ii", "2") ); - - aliasSet.add(vejnavn.replace("3", "iii") ); - aliasSet.add(vejnavn.replace("iii", "3") ); - - aliasSet.add(vejnavn.replace("4", "iv") ); - aliasSet.add(vejnavn.replace("iv", "4") ); - - aliasSet.add(vejnavn.replace("5", "v") ); - aliasSet.add(vejnavn.replace("v", "5") ); - - aliasSet.add(vejnavn.replace("6", "vi") ); - aliasSet.add(vejnavn.replace("vi", "6") ); - - aliasSet.add(vejnavn.replace("7", "vii") ); - aliasSet.add(vejnavn.replace("vii", "7") ); - - aliasSet.add(vejnavn.replace("8", "viii") ); - aliasSet.add(vejnavn.replace("viii", "8") ); - - aliasSet.add(vejnavn.replace("9", "ix") ); - aliasSet.add(vejnavn.replace("ix", "9") ); - - aliasSet.add(vejnavn.replace("10", "x") ); - aliasSet.add(vejnavn.replace("x", "10") ); - - - //alternative måder at stave vej/gade/alle - aliasSet.add(vejnavn.replace("vej", "ve") ); - aliasSet.add(vejnavn.replace("vej", "vj") ); - aliasSet.add(vejnavn.replace("vej", "v") ); - aliasSet.add(vejnavn.replace("vej", "vejen") ); - aliasSet.add(vejnavn.replace("vejen", "vej") ); - - aliasSet.add(vejnavn.replace("v", "vej") );//Vi kan have vejnavne i DB der bare slutter på v istedet for vej - - aliasSet.add(vejnavn.replace("alle", "all") ); - aliasSet.add(vejnavn.replace("allé", "all") ); - aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo - aliasSet.add(vejnavn.replace("allé", "allú") ); - - aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo - aliasSet.add(vejnavn.replace("gade", "gde") ); - - aliasSet.add(vejnavn.replace("plads", "pl") ); - aliasSet.add(vejnavn.replace("vænget", "vænge") ); - - aliasSet.add(vejnavn.replace("boulevard", "blvd") ); - aliasSet.add(vejnavn.replace("blvd", "boulevard") ); - - aliasSet.add(vejnavn.replace("boulevard", "boule") ); - aliasSet.add(vejnavn.replace("boule", "boulevard") ); - - aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 - aliasSet.add(vejnavn.replace("krbg", "kronborg") ); - - // Opbyg æøå varianter over alle fundne aliaser - - @SuppressWarnings("unchecked") - HashSet variants = (HashSet) aliasSet.clone(); - - for (String vVejnavn : variants) { - // danske tegn 1 - aliasSet.add( vVejnavn.replace("æ", "ae") ); - aliasSet.add( vVejnavn.replace("ø", "oe") ); - aliasSet.add( vVejnavn.replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ae", "æ") ); - aliasSet.add( vVejnavn.replace("oe", "ø") ); - aliasSet.add( vVejnavn.replace("aa", "å") ); - - //danske tegn 2 - aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") ); - aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ø", "oe").replace("å", "aa") ); - aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") ); - aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") ); - aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); - - //danske tegn 3 - aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); - aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); - - - //udenlandsketegn - aliasSet.add(vejnavn.replace("u", "ü") ); - aliasSet.add(vejnavn.replace("ü", "u") ); - - aliasSet.add(vejnavn.replace("ä", "æ") ); - aliasSet.add(vejnavn.replace("æ", "ä") ); - - aliasSet.add(vejnavn.replace("ö", "ø") ); - aliasSet.add(vejnavn.replace("ø", "ö") ); - } - - return aliasSet; - } public Set getPostnumre() { return new TreeSet( searchPostnrVejnavnGadeid.keySet() ); @@ -846,9 +681,8 @@ } public Address getAdresse(int gadeid, String husnrStr) { - - short husnr = Short.parseShort( husnrStr.replaceAll("\\d","") ); - String litra = husnrStr.replaceAll("^\\d", ""); + short husnr = Short.parseShort( husnrStr.replaceAll("[^\\d]","") ); + String litra = husnrStr.replaceAll("\\d", ""); Map> gade = searchGadeidentAdresser.get(gadeid); Map litraList = gade.get(husnr);