27 |
import dk.daoas.daoadresseservice.beans.SearchResult; |
import dk.daoas.daoadresseservice.beans.SearchResult; |
28 |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
29 |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
30 |
|
import dk.daoas.daoadresseservice.util.DaoUtils; |
31 |
import dk.daoas.daoadresseservice.util.DeduplicateHelper; |
import dk.daoas.daoadresseservice.util.DeduplicateHelper; |
32 |
import dk.daoas.daoadresseservice.util.NaturalOrderComparator; |
import dk.daoas.daoadresseservice.util.NaturalOrderComparator; |
33 |
|
|
42 |
|
|
43 |
private DataStatisticsBean stats = new DataStatisticsBean(); |
private DataStatisticsBean stats = new DataStatisticsBean(); |
44 |
|
|
45 |
|
private DatabaseLayer db; |
46 |
|
|
47 |
ServiceConfig config; |
ServiceConfig config; |
48 |
|
|
49 |
StreetnameHelper levenshteinHelper; |
StreetnameHelper levenshteinHelper; |
51 |
StreetnameHelper osmHelper; |
StreetnameHelper osmHelper; |
52 |
|
|
53 |
|
|
54 |
public AddressSearch(ServiceConfig config) { |
public AddressSearch(DatabaseLayer db, ServiceConfig config) { |
55 |
this.config = config; |
this.config = config; |
56 |
|
|
57 |
|
this.db = db; |
58 |
|
|
59 |
levenshteinHelper = new LevenshteinStreetnameHelper( this ); |
levenshteinHelper = new LevenshteinStreetnameHelper( this ); |
60 |
googleHelper = new GoogleStreetnameHelper( config ); |
googleHelper = new GoogleStreetnameHelper( config ); |
61 |
osmHelper = new OSMStreetnameHelper( config ); |
osmHelper = new OSMStreetnameHelper( config ); |
71 |
SearchRequest request = new SearchRequest(); |
SearchRequest request = new SearchRequest(); |
72 |
SearchResult result = new SearchResult(); |
SearchResult result = new SearchResult(); |
73 |
|
|
|
|
|
|
String helperSearchKey = ""; |
|
74 |
|
|
75 |
try { |
try { |
76 |
request.postnr = Short.parseShort(postnrStr); |
request.postnr = Short.parseShort(postnrStr); |
112 |
return result; |
return result; |
113 |
} |
} |
114 |
|
|
115 |
Integer gadeident = request.streetNames.get(result.vasketVejnavn); |
// LookupStreetname er en indkapsling af alm + levenstein + google + osm |
116 |
|
Integer gadeident = lookupStretname(request, result, true); |
117 |
|
|
|
if ( gadeident == null) { |
|
|
helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn; |
|
|
gadeident = helperCache.get(helperSearchKey); |
|
|
} |
|
118 |
|
|
119 |
|
/* |
120 |
|
* Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn |
121 |
|
* |
122 |
|
* <strike>Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt</strike>*/ |
123 |
if (gadeident == null) { |
if (gadeident == null) { |
124 |
String vej = levenshteinHelper.proposeStreetName(request, result); |
final int MAX_TRIES = 4; |
125 |
if (vej != null) { |
|
126 |
gadeident = request.streetNames.get(vej); |
String vejnavnParts[] = request.vejnavn.split(" "); |
127 |
} |
|
128 |
} |
for (int i=1; i<=MAX_TRIES && i<vejnavnParts.length; i++) { |
129 |
|
String subVejnavn = DaoUtils.joinHelper(vejnavnParts, i); |
130 |
|
|
131 |
// Brug OpenStreetMap før vi prøver google |
request.vejnavn = subVejnavn; |
132 |
// For google har en request limit, det har OSM ikke! |
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
133 |
if ( gadeident == null) { |
|
134 |
String vej = osmHelper.proposeStreetName(request, result); |
gadeident = lookupStretname(request, result, false);//prøv opslag MEN UDEN GOOGLE/OSM !!! |
135 |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
136 |
} |
//hvis vi fandt vejen ud fra substrengen |
137 |
|
if (gadeident != null) { |
138 |
if ( gadeident == null) { |
break; |
139 |
String vej = googleHelper.proposeStreetName(request, result); |
} |
140 |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
141 |
|
//hvis vi ikke fandt kopierer vi vejnavn fra split igen |
142 |
|
request.vejnavn = result.splitResult.vej; |
143 |
|
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
144 |
|
} |
145 |
} |
} |
146 |
|
|
147 |
|
|
191 |
|
|
192 |
return result; |
return result; |
193 |
} |
} |
194 |
|
|
195 |
|
|
196 |
|
private Integer lookupStretname(SearchRequest request, SearchResult result, boolean useExternal) { |
197 |
|
String helperSearchKey = ""; |
198 |
|
|
199 |
|
Integer gadeident = request.streetNames.get(result.vasketVejnavn); |
200 |
|
|
201 |
|
|
202 |
|
if ( gadeident == null) { |
203 |
|
helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn; |
204 |
|
gadeident = helperCache.get(helperSearchKey); |
205 |
|
} |
206 |
|
|
207 |
|
if (gadeident == null) { |
208 |
|
String vej = levenshteinHelper.proposeStreetName(request, result); |
209 |
|
if (vej != null) { |
210 |
|
gadeident = request.streetNames.get(vej); |
211 |
|
} |
212 |
|
} |
213 |
|
|
214 |
|
|
215 |
|
// Brug OpenStreetMap før vi prøver google |
216 |
|
// For google har en request limit, det har OSM ikke! |
217 |
|
if ( gadeident == null && useExternal) { |
218 |
|
String vej = osmHelper.proposeStreetName(request, result); |
219 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
220 |
|
} |
221 |
|
|
222 |
|
if ( gadeident == null && useExternal) { |
223 |
|
String vej = googleHelper.proposeStreetName(request, result); |
224 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
225 |
|
} |
226 |
|
return gadeident; |
227 |
|
} |
228 |
|
|
229 |
private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) { |
private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) { |
230 |
if (vej == null) |
if (vej == null) |
254 |
long start1 = System.currentTimeMillis(); |
long start1 = System.currentTimeMillis(); |
255 |
System.out.println("Build -- stage 1"); |
System.out.println("Build -- stage 1"); |
256 |
|
|
257 |
alleAdresser = DatabaseLayer.getAllAdresses(); |
alleAdresser = db.getAllAdresses(); |
258 |
|
|
259 |
|
|
260 |
/* Mapper mellem db Row ID og adresse noden */ |
/* Mapper mellem db Row ID og adresse noden */ |
305 |
System.out.println("Build -- stage 2 alias tabel"); |
System.out.println("Build -- stage 2 alias tabel"); |
306 |
|
|
307 |
int vaskCount = 0; |
int vaskCount = 0; |
308 |
List<AliasBean> aliasList = DatabaseLayer.getAliasList(); |
List<AliasBean> aliasList = db.getAliasList(); |
309 |
for (AliasBean alias : aliasList) { |
for (AliasBean alias : aliasList) { |
310 |
Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
311 |
|
|
342 |
DeduplicateHelper<String> ruteHelper = new DeduplicateHelper<String>(); |
DeduplicateHelper<String> ruteHelper = new DeduplicateHelper<String>(); |
343 |
DeduplicateHelper<String> korelisteHelper = new DeduplicateHelper<String>(); |
DeduplicateHelper<String> korelisteHelper = new DeduplicateHelper<String>(); |
344 |
|
|
345 |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
List<ExtendedBean> extDao = db.getExtendedAdresslist(); |
346 |
for (ExtendedBean eb : extDao) { |
for (ExtendedBean eb : extDao) { |
347 |
|
|
348 |
Address orgAddress = idAddressMap.get(eb.orgId); |
Address orgAddress = idAddressMap.get(eb.orgId); |
416 |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
417 |
System.out.println("Build -- stage 4 - 100pct"); |
System.out.println("Build -- stage 4 - 100pct"); |
418 |
|
|
419 |
Map<Short,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
Map<Short,HundredePctBean> hundredePct = db.get100PctList(); |
420 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
421 |
if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) { |
if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) { |
422 |
continue; |
continue; |
459 |
stats.ikkeDaekketCount++; |
stats.ikkeDaekketCount++; |
460 |
} |
} |
461 |
} |
} |
462 |
|
stats.totalCount = alleAdresser.size(); |
463 |
|
|
464 |
|
|
465 |
stats.elapsed = stop-start1; |
stats.elapsed = stop-start1; |
466 |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
467 |
|
|
468 |
|
System.out.println("Build: totalCount: " + stats.totalCount); |
469 |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
470 |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
471 |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
480 |
return stats; |
return stats; |
481 |
} |
} |
482 |
|
|
483 |
|
public DatabaseLayer getDatabaseLayer() { |
484 |
|
return db; |
485 |
|
} |
486 |
|
|
487 |
public void clear() { |
public void clear() { |
488 |
searchPostnrVejnavnGadeid.clear(); |
searchPostnrVejnavnGadeid.clear(); |
489 |
searchGadeidentAdresser.clear(); |
searchGadeidentAdresser.clear(); |
562 |
vejnavn = vejnavn.toLowerCase(); |
vejnavn = vejnavn.toLowerCase(); |
563 |
HashSet<String> aliasSet = new HashSet<String>(); |
HashSet<String> aliasSet = new HashSet<String>(); |
564 |
aliasSet.add(vejnavn); |
aliasSet.add(vejnavn); |
565 |
|
|
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
|
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
|
|
|
|
566 |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
567 |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
568 |
|
|
594 |
aliasSet.add(vejnavn.replace("st.", "store") ); |
aliasSet.add(vejnavn.replace("st.", "store") ); |
595 |
|
|
596 |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
597 |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
598 |
|
aliasSet.add(vejnavn.replace("sønder", "sdr") ); |
599 |
|
aliasSet.add(vejnavn.replace("sdr", "sønder") ); |
600 |
|
|
601 |
|
|
602 |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
632 |
aliasSet.add(vejnavn.replace("john", "j") ); |
aliasSet.add(vejnavn.replace("john", "j") ); |
633 |
aliasSet.add(vejnavn.replace("thomas", "th") ); |
aliasSet.add(vejnavn.replace("thomas", "th") ); |
634 |
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
635 |
|
aliasSet.add(vejnavn.replace("frederik", "fr") ); |
636 |
|
aliasSet.add(vejnavn.replace("frederiks", "fr") ); |
637 |
|
|
638 |
|
|
639 |
aliasSet.add(vejnavn.replace("christian", "chr") ); |
aliasSet.add(vejnavn.replace("christian", "chr") ); |
640 |
|
aliasSet.add(vejnavn.replace("christians", "chr") ); |
641 |
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
642 |
|
aliasSet.add(vejnavn.replace("kristians", "kr") ); |
643 |
|
|
644 |
|
|
645 |
// alternative stavninger |
// alternative stavninger |
699 |
|
|
700 |
aliasSet.add(vejnavn.replace("plads", "pl") ); |
aliasSet.add(vejnavn.replace("plads", "pl") ); |
701 |
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
702 |
|
|
703 |
|
aliasSet.add(vejnavn.replace("boulevard", "blvd") ); |
704 |
|
aliasSet.add(vejnavn.replace("blvd", "boulevard") ); |
705 |
|
|
706 |
|
aliasSet.add(vejnavn.replace("boulevard", "boule") ); |
707 |
|
aliasSet.add(vejnavn.replace("boule", "boulevard") ); |
708 |
|
|
709 |
|
aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 |
710 |
|
aliasSet.add(vejnavn.replace("krbg", "kronborg") ); |
711 |
|
|
712 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
713 |
|
|
734 |
//danske tegn 3 |
//danske tegn 3 |
735 |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
736 |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
737 |
|
|
738 |
|
|
739 |
|
//udenlandsketegn |
740 |
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
741 |
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
742 |
|
|
743 |
|
aliasSet.add(vejnavn.replace("ä", "æ") ); |
744 |
|
aliasSet.add(vejnavn.replace("æ", "ä") ); |
745 |
|
|
746 |
|
aliasSet.add(vejnavn.replace("ö", "ø") ); |
747 |
|
aliasSet.add(vejnavn.replace("ø", "ö") ); |
748 |
} |
} |
749 |
|
|
750 |
return aliasSet; |
return aliasSet; |