--- dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2015/05/21 08:06:16 2550
+++ dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java 2015/07/15 06:52:05 2608
@@ -27,6 +27,7 @@
import dk.daoas.daoadresseservice.beans.SearchResult;
import dk.daoas.daoadresseservice.beans.SearchResult.Status;
import dk.daoas.daoadresseservice.db.DatabaseLayer;
+import dk.daoas.daoadresseservice.util.DaoUtils;
import dk.daoas.daoadresseservice.util.DeduplicateHelper;
import dk.daoas.daoadresseservice.util.NaturalOrderComparator;
@@ -41,6 +42,8 @@
private DataStatisticsBean stats = new DataStatisticsBean();
+ private DatabaseLayer db;
+
ServiceConfig config;
StreetnameHelper levenshteinHelper;
@@ -48,9 +51,11 @@
StreetnameHelper osmHelper;
- public AddressSearch(ServiceConfig config) {
+ public AddressSearch(DatabaseLayer db, ServiceConfig config) {
this.config = config;
+ this.db = db;
+
levenshteinHelper = new LevenshteinStreetnameHelper( this );
googleHelper = new GoogleStreetnameHelper( config );
osmHelper = new OSMStreetnameHelper( config );
@@ -66,8 +71,6 @@
SearchRequest request = new SearchRequest();
SearchResult result = new SearchResult();
-
- String helperSearchKey = "";
try {
request.postnr = Short.parseShort(postnrStr);
@@ -109,32 +112,36 @@
return result;
}
- Integer gadeident = request.streetNames.get(result.vasketVejnavn);
+ // LookupStreetname er en indkapsling af alm + levenstein + google + osm
+ Integer gadeident = lookupStretname(request, result, true);
- if ( gadeident == null) {
- helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn;
- gadeident = helperCache.get(helperSearchKey);
- }
-
+ /*
+ * Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn
+ *
+ * Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt*/
if (gadeident == null) {
- String vej = levenshteinHelper.proposeStreetName(request, result);
- if (vej != null) {
- gadeident = request.streetNames.get(vej);
- }
- }
-
-
- // Brug OpenStreetMap før vi prøver google
- // For google har en request limit, det har OSM ikke!
- if ( gadeident == null) {
- String vej = osmHelper.proposeStreetName(request, result);
- gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
- }
-
- if ( gadeident == null) {
- String vej = googleHelper.proposeStreetName(request, result);
- gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
+ final int MAX_TRIES = 4;
+
+ String vejnavnParts[] = request.vejnavn.split(" ");
+
+ for (int i=1; i<=MAX_TRIES && i postnrVeje, String helperSearchKey) {
if (vej == null)
@@ -213,7 +254,7 @@
long start1 = System.currentTimeMillis();
System.out.println("Build -- stage 1");
- alleAdresser = DatabaseLayer.getAllAdresses();
+ alleAdresser = db.getAllAdresses();
/* Mapper mellem db Row ID og adresse noden */
@@ -264,7 +305,7 @@
System.out.println("Build -- stage 2 alias tabel");
int vaskCount = 0;
- List aliasList = DatabaseLayer.getAliasList();
+ List aliasList = db.getAliasList();
for (AliasBean alias : aliasList) {
Map postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr);
@@ -301,7 +342,7 @@
DeduplicateHelper ruteHelper = new DeduplicateHelper();
DeduplicateHelper korelisteHelper = new DeduplicateHelper();
- List extDao = DatabaseLayer.getExtendedAdresslist();
+ List extDao = db.getExtendedAdresslist();
for (ExtendedBean eb : extDao) {
Address orgAddress = idAddressMap.get(eb.orgId);
@@ -375,7 +416,7 @@
System.out.println("Build, stage3 elapsed: " + (start4-start3) );
System.out.println("Build -- stage 4 - 100pct");
- Map hundredePct = DatabaseLayer.get100PctList();
+ Map hundredePct = db.get100PctList();
for (Address addr : alleAdresser) {
if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {
continue;
@@ -418,11 +459,13 @@
stats.ikkeDaekketCount++;
}
}
+ stats.totalCount = alleAdresser.size();
stats.elapsed = stop-start1;
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
+ System.out.println("Build: totalCount: " + stats.totalCount);
System.out.println("Build: direkteCount: " + stats.direkteCount);
System.out.println("Build: extendedCount: " + stats.extendedCount);
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
@@ -437,6 +480,10 @@
return stats;
}
+ public DatabaseLayer getDatabaseLayer() {
+ return db;
+ }
+
public void clear() {
searchPostnrVejnavnGadeid.clear();
searchGadeidentAdresser.clear();
@@ -515,10 +562,7 @@
vejnavn = vejnavn.toLowerCase();
HashSet aliasSet = new HashSet();
aliasSet.add(vejnavn);
-
- aliasSet.add(vejnavn.replace("u", "ü") );
- aliasSet.add(vejnavn.replace("ü", "u") );
-
+
aliasSet.add(vejnavn.replace("alle", "allé") );
aliasSet.add(vejnavn.replace("allé", "alle") );
@@ -550,7 +594,9 @@
aliasSet.add(vejnavn.replace("st.", "store") );
aliasSet.add(vejnavn.replace("søndre", "sdr") );
- aliasSet.add(vejnavn.replace("sdr", "søndre") );
+ aliasSet.add(vejnavn.replace("sdr", "søndre") );
+ aliasSet.add(vejnavn.replace("sønder", "sdr") );
+ aliasSet.add(vejnavn.replace("sdr", "sønder") );
aliasSet.add(vejnavn.replace("nørre", "nr") );
@@ -559,6 +605,16 @@
aliasSet.add(vejnavn.replace("nordre", "ndr") );
aliasSet.add(vejnavn.replace("ndr", "nordre") );
+
+ aliasSet.add(vejnavn.replace("vestre", "vester") );
+ aliasSet.add(vejnavn.replace("vester", "vestre") );
+
+ aliasSet.add(vejnavn.replace("søndre", "sønder") );
+ aliasSet.add(vejnavn.replace("sønder", "søndre") );
+
+ aliasSet.add(vejnavn.replace("østre", "øster") );
+ aliasSet.add(vejnavn.replace("øster", "østre") );
+
aliasSet.add(vejnavn.replace("borgmester", "borgm") );
aliasSet.add(vejnavn.replace("borgm", "borgmester") );
@@ -576,10 +632,14 @@
aliasSet.add(vejnavn.replace("john", "j") );
aliasSet.add(vejnavn.replace("thomas", "th") );
aliasSet.add(vejnavn.replace("thorvald", "th") );
+ aliasSet.add(vejnavn.replace("frederik", "fr") );
+ aliasSet.add(vejnavn.replace("frederiks", "fr") );
aliasSet.add(vejnavn.replace("christian", "chr") );
+ aliasSet.add(vejnavn.replace("christians", "chr") );
aliasSet.add(vejnavn.replace("kristian", "kr") );
+ aliasSet.add(vejnavn.replace("kristians", "kr") );
// alternative stavninger
@@ -639,7 +699,15 @@
aliasSet.add(vejnavn.replace("plads", "pl") );
aliasSet.add(vejnavn.replace("vænget", "vænge") );
-
+
+ aliasSet.add(vejnavn.replace("boulevard", "blvd") );
+ aliasSet.add(vejnavn.replace("blvd", "boulevard") );
+
+ aliasSet.add(vejnavn.replace("boulevard", "boule") );
+ aliasSet.add(vejnavn.replace("boule", "boulevard") );
+
+ aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000
+ aliasSet.add(vejnavn.replace("krbg", "kronborg") );
// Opbyg æøå varianter over alle fundne aliaser
@@ -666,6 +734,17 @@
//danske tegn 3
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
+
+
+ //udenlandsketegn
+ aliasSet.add(vejnavn.replace("u", "ü") );
+ aliasSet.add(vejnavn.replace("ü", "u") );
+
+ aliasSet.add(vejnavn.replace("ä", "æ") );
+ aliasSet.add(vejnavn.replace("æ", "ä") );
+
+ aliasSet.add(vejnavn.replace("ö", "ø") );
+ aliasSet.add(vejnavn.replace("ø", "ö") );
}
return aliasSet;