--- dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2015/11/26 12:28:27 2783 +++ dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2016/01/14 07:54:17 2805 @@ -30,6 +30,7 @@ import dk.daoas.daoadresseservice.util.DaoUtils; import dk.daoas.daoadresseservice.util.DeduplicateHelper; import dk.daoas.daoadresseservice.util.NaturalOrderComparator; +import dk.daoas.daoadresseservice.util.NearestShortTreeMap; public class AddressSearch { @@ -44,6 +45,7 @@ private DataStatisticsBean stats = new DataStatisticsBean(); private DatabaseLayer db; + private ServiceConfig config; StreetnameHelper levenshteinHelper; @@ -55,6 +57,7 @@ public AddressSearch(DatabaseLayer db, ServiceConfig config) { this.db = db; + this.config = config; levenshteinHelper = new LevenshteinStreetnameHelper( this ); metaphoneHelper = new DoubleMetaphoneStreetnameHelper(config); @@ -81,8 +84,13 @@ return addr; } - + public SearchResult search(String postnrStr, String adresse) { + return search(postnrStr, adresse, false); + } + + + public SearchResult search(String postnrStr, String adresse, boolean naermesteHusnr) { postnrStr = postnrStr.trim(); adresse = adresse.trim(); @@ -190,16 +198,32 @@ if (litraList == null) { //Husnr ikke fundet - result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; - return result; + + if (naermesteHusnr) { + TreeMap> gadeTreeMap = (TreeMap>) gade; + result.anvendtHusnr = NearestShortTreeMap.getNearestKey(husnrSearch, gadeTreeMap); + + result.nearestHusnr = true; + litraList = gade.get(result.anvendtHusnr); + + + } else { + result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; + return result; + } } Address addr = litraList.get( result.splitResult.litra ); - if (addr == null) { - //husnr fundet men litra blev ikke fundet - result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; - return result; + if (addr == null) { //litra ikke fundet + if (config.nearestLitra == true || naermesteHusnr == true) { + result.nearestLitra = true; + addr = litraList.values().iterator().next(); + } else { + //husnr fundet men litra blev ikke fundet + result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; + return result; + } } result.address = addr; @@ -241,7 +265,7 @@ } if (gadeident == null) { - String vej = levenshteinHelper.proposeStreetName(request, result); + String vej = metaphoneHelper.proposeStreetName(request, result); if (vej != null) { gadeident = request.streetNames.get(vej); } @@ -295,16 +319,22 @@ /* Mapper mellem db Row ID og adresse noden */ Map idAddressMap = new HashMap( alleAdresser.size() ); - DeduplicateHelper aliasHelper = new DeduplicateHelper(); + DeduplicateHelper aliasHelper = new DeduplicateHelper(400000); // Indeholder pt 379664 entries + + DeduplicateHelper shortHelper = new DeduplicateHelper(); + DeduplicateHelper intHelper = new DeduplicateHelper(); + for (Address a : alleAdresser) { idAddressMap.put(a.id, a); - Map postnrVeje = searchPostnrVejnavnGadeid.get(a.postnr); + Short postnr = shortHelper.getInstance(a.postnr); + + Map postnrVeje = searchPostnrVejnavnGadeid.get(postnr); if (postnrVeje == null) { - postnrVeje = new ConcurrentHashMap(); - searchPostnrVejnavnGadeid.put(a.postnr, postnrVeje); + postnrVeje = new HashMap(10240); //lige nu indeholder den største 9500 entries + searchPostnrVejnavnGadeid.put(postnr, postnrVeje); } @@ -313,7 +343,7 @@ if (gadeident == null) { //postnrVeje.put(vasketVejnavn, a.gadeid); - gadeident = a.gadeid; + gadeident = intHelper.getInstance( a.gadeid ); Set aliaser = findVejAliaser(a.vejnavn); for(String alias : aliaser) { @@ -321,9 +351,11 @@ vasketAlias = aliasHelper.getInstance(vasketAlias); postnrVeje.put(vasketAlias, gadeident); - } + } + } + Map> gade = searchGadeidentAdresser.get(gadeident); if (gade == null) { gade = new TreeMap>(); @@ -338,7 +370,8 @@ litraList.put(a.husnrbogstav, a); } - + + //////////////////////////////////////////////////////////////////////////////////////// long start2 = System.currentTimeMillis(); System.out.println("Build, stage1 elapsed: " + (start2-start1) ); @@ -773,8 +806,7 @@ // Opbyg æøå varianter over alle fundne aliaser - @SuppressWarnings("unchecked") - HashSet variants = (HashSet) aliasSet.clone(); + HashSet variants = new HashSet( aliasSet ); for (String vVejnavn : variants) { // danske tegn 1 @@ -794,19 +826,19 @@ aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); //danske tegn 3 - aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); - aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); + aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); + aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); //udenlandsketegn - aliasSet.add(vejnavn.replace("u", "ü") ); - aliasSet.add(vejnavn.replace("ü", "u") ); + aliasSet.add( vVejnavn.replace("u", "ü") ); + aliasSet.add( vVejnavn.replace("ü", "u") ); - aliasSet.add(vejnavn.replace("ä", "æ") ); - aliasSet.add(vejnavn.replace("æ", "ä") ); + aliasSet.add( vVejnavn.replace("ä", "æ") ); + aliasSet.add( vVejnavn.replace("æ", "ä") ); - aliasSet.add(vejnavn.replace("ö", "ø") ); - aliasSet.add(vejnavn.replace("ø", "ö") ); + aliasSet.add( vVejnavn.replace("ö", "ø") ); + aliasSet.add( vVejnavn.replace("ø", "ö") ); } return aliasSet; @@ -839,9 +871,8 @@ } public Address getAdresse(int gadeid, String husnrStr) { - - short husnr = Short.parseShort( husnrStr.replaceAll("\\d","") ); - String litra = husnrStr.replaceAll("^\\d", ""); + short husnr = Short.parseShort( husnrStr.replaceAll("[^\\d]","") ); + String litra = husnrStr.replaceAll("\\d", ""); Map> gade = searchGadeidentAdresser.get(gadeid); Map litraList = gade.get(husnr);