16 |
|
|
17 |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
18 |
import dk.daoas.daoadresseservice.beans.Address; |
import dk.daoas.daoadresseservice.beans.Address; |
19 |
|
import dk.daoas.daoadresseservice.beans.AliasBean; |
20 |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
21 |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
22 |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
23 |
|
import dk.daoas.daoadresseservice.beans.SearchRequest; |
24 |
import dk.daoas.daoadresseservice.beans.SearchResult; |
import dk.daoas.daoadresseservice.beans.SearchResult; |
25 |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
26 |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
27 |
|
|
28 |
public class AdressSearch { |
public class AddressSearch { |
29 |
|
|
30 |
private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid; |
private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid; |
31 |
private Map<Long, Map<String,Address>> searchGadeidentAdresser; |
private Map<Long, Map<String,Address>> searchGadeidentAdresser; |
38 |
|
|
39 |
ServiceConfig config; |
ServiceConfig config; |
40 |
|
|
41 |
public AdressSearch(ServiceConfig config) { |
StreetnameHelper levenshteinHelper; |
42 |
|
StreetnameHelper googleHelper; |
43 |
|
StreetnameHelper osmHelper; |
44 |
|
|
45 |
|
|
46 |
|
public AddressSearch(ServiceConfig config) { |
47 |
this.config = config; |
this.config = config; |
48 |
|
|
49 |
|
levenshteinHelper = new LevenshteinStreetnameHelper( this ); |
50 |
|
googleHelper = new GoogleStreetnameHelper( config ); |
51 |
|
osmHelper = new OSMStreetnameHelper( config ); |
52 |
} |
} |
53 |
|
|
54 |
|
|
55 |
public SearchResult search(String postnrStr, String adresse) { |
public SearchResult search(String postnrStr, String adresse) { |
56 |
|
SearchRequest request = new SearchRequest(); |
57 |
SearchResult result = new SearchResult(); |
SearchResult result = new SearchResult(); |
58 |
|
|
|
int postnr=0; |
|
59 |
|
|
60 |
String helperSearchKey = ""; |
String helperSearchKey = ""; |
61 |
|
|
62 |
try { |
try { |
63 |
postnr = Integer.parseInt(postnrStr); |
request.postnr = Integer.parseInt(postnrStr); |
64 |
} catch (Exception E) { |
} catch (Exception E) { |
65 |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
66 |
return result; |
return result; |
67 |
} |
} |
68 |
|
|
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr); |
|
69 |
|
|
70 |
if (postnrVeje == null) { |
request.streetNames = searchPostnrVejnavnGadeid.get(request.postnr); |
71 |
|
|
72 |
|
if (request.streetNames == null) { |
73 |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
74 |
return result; |
return result; |
75 |
} |
} |
76 |
|
|
77 |
|
|
78 |
result.splitResult = AddressUtils.splitAdresse(adresse); |
result.splitResult = AddressUtils.splitAdresse(adresse); |
79 |
|
request.vejnavn = result.splitResult.vej; |
80 |
|
|
81 |
|
|
82 |
|
|
83 |
if (result.splitResult.husnr.length() == 0) { |
if (result.splitResult.husnr.length() == 0) { |
85 |
return result; |
return result; |
86 |
} |
} |
87 |
|
|
88 |
String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej ); |
request.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
89 |
|
|
90 |
|
|
91 |
|
if (request.vasketVejnavn.indexOf("pakkebo") > -1 || request.vasketVejnavn.indexOf("døgnpost") > -1) { |
92 |
|
result.status = Status.ERROR_POSTBOX; |
93 |
|
return result; |
94 |
|
} |
95 |
|
|
96 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Long gadeident = request.streetNames.get(request.vasketVejnavn); |
97 |
|
|
98 |
|
|
99 |
if ( gadeident == null) { |
if ( gadeident == null) { |
100 |
helperSearchKey = "" + postnr + "/" + vasketVejnavn; |
helperSearchKey = "" + request.postnr + "/" + request.vasketVejnavn; |
101 |
gadeident = helperCache.get(helperSearchKey); |
gadeident = helperCache.get(helperSearchKey); |
102 |
} |
} |
103 |
|
|
104 |
if (gadeident == null) { |
if (gadeident == null) { |
105 |
String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje); |
String vej = levenshteinHelper.proposeStreetName(request, result); |
106 |
if (best != null) { |
if (vej != null) { |
107 |
gadeident = postnrVeje.get(best); |
gadeident = request.streetNames.get(vej); |
108 |
} |
} |
109 |
} |
} |
110 |
|
|
112 |
// Brug OpenStreetMap før vi prøver google |
// Brug OpenStreetMap før vi prøver google |
113 |
// For google har en request limit, det har OSM ikke! |
// For google har en request limit, det har OSM ikke! |
114 |
if ( gadeident == null) { |
if ( gadeident == null) { |
115 |
if (config.useOpenStreetMaps) { |
String vej = osmHelper.proposeStreetName(request, result); |
116 |
result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej ); |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
result.osm = true; |
|
|
|
|
|
if (result.osmVej != null) { |
|
|
String osmVasket = AddressUtils.vaskVejnavn( result.osmVej ); |
|
|
gadeident = postnrVeje.get(osmVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
|
} |
|
117 |
} |
} |
118 |
|
|
119 |
if ( gadeident == null) { |
if ( gadeident == null) { |
120 |
if (config.useGoogle) { |
String vej = googleHelper.proposeStreetName(request, result); |
121 |
result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej ); |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
result.google = true; |
|
|
|
|
|
if (result.googleVej != null) { |
|
|
String googleVasket = AddressUtils.vaskVejnavn( result.googleVej ); |
|
|
gadeident = postnrVeje.get(googleVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
|
} |
|
122 |
} |
} |
123 |
|
|
124 |
|
|
128 |
return result; |
return result; |
129 |
} |
} |
130 |
|
|
131 |
|
result.gadeident = gadeident; |
132 |
|
|
133 |
|
|
134 |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
135 |
if (gade == null) { //Denne søgning må ikke fejle |
if (gade == null) { //Denne søgning må ikke fejle |
136 |
result.status = Status.ERROR_INTERNAL; |
result.status = Status.ERROR_INTERNAL; |
138 |
} |
} |
139 |
|
|
140 |
|
|
141 |
|
//Kunne evt klares med Iterables.get fra Guava/Collections |
142 |
|
Address firstAddress = gade.values().iterator().next(); |
143 |
|
result.vej = firstAddress.vejnavn; |
144 |
|
|
145 |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
146 |
Address addr = gade.get(husnrSearch); |
Address addr = gade.get(husnrSearch); |
147 |
|
|
169 |
return result; |
return result; |
170 |
} |
} |
171 |
|
|
172 |
|
private Long helperWrapper(String vej, Map<String,Long> postnrVeje, String helperSearchKey) { |
173 |
|
if (vej == null) |
174 |
|
return null; |
175 |
|
|
176 |
|
String vejVasket = AddressUtils.vaskVejnavn( vej ); |
177 |
|
Long gadeident = postnrVeje.get(vejVasket); |
178 |
|
|
179 |
|
if (gadeident != null) { |
180 |
|
helperCache.put(helperSearchKey, gadeident); |
181 |
|
} |
182 |
|
return gadeident; |
183 |
|
|
184 |
|
} |
185 |
|
|
186 |
|
public Map<String,Long> getStretsByPostal(int zip) { |
187 |
|
return searchPostnrVejnavnGadeid.get(zip); |
188 |
|
} |
189 |
|
|
190 |
|
|
191 |
|
|
192 |
public void buildSearchStructures() throws SQLException{ |
public void buildSearchStructures() throws SQLException{ |
193 |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
215 |
|
|
216 |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
217 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Long gadeident = postnrVeje.get(vasketVejnavn); |
218 |
if (gadeident == null) { |
if (gadeident == null) { |
219 |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
220 |
|
|
221 |
|
gadeident = a.gadeid; |
222 |
|
|
223 |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
224 |
for(String alias : aliaser) { |
for(String alias : aliaser) { |
225 |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
226 |
postnrVeje.put(vasketAlias, a.gadeid); |
postnrVeje.put(vasketAlias, gadeident); |
227 |
} |
} |
|
|
|
228 |
} |
} |
229 |
|
|
230 |
Map<String, Address> gade = searchGadeidentAdresser.get(a.gadeid); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
231 |
if (gade == null) { |
if (gade == null) { |
232 |
gade = new HashMap<String, Address>(); |
gade = new HashMap<String, Address>(); |
233 |
searchGadeidentAdresser.put(a.gadeid, gade); |
searchGadeidentAdresser.put(gadeident, gade); |
234 |
} |
} |
235 |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
236 |
gade.put(husnrSearch, a); |
gade.put(husnrSearch, a); |
237 |
} |
} |
238 |
|
|
|
|
|
239 |
//////////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////////// |
240 |
long start2 = System.currentTimeMillis(); |
long start2 = System.currentTimeMillis(); |
241 |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
242 |
System.out.println("Build -- stage 2 udvidet dækning"); |
System.out.println("Build -- stage 2 alias tabel"); |
243 |
|
|
244 |
|
int vaskCount = 0; |
245 |
|
List<AliasBean> aliasList = DatabaseLayer.getAliasList(); |
246 |
|
for (AliasBean alias : aliasList) { |
247 |
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
248 |
|
|
249 |
|
if (postnrVeje == null) { |
250 |
|
//Burde ikke kunne ske - men better safe than sorry |
251 |
|
continue; |
252 |
|
} |
253 |
|
|
254 |
|
String vasketVej = AddressUtils.vaskVejnavn(alias.vejnavn); |
255 |
|
String vasketAlias = AddressUtils.vaskVejnavn(alias.aliasVejnavn); |
256 |
|
|
257 |
|
Long gadeident = postnrVeje.get(vasketVej); |
258 |
|
if (gadeident == null) { |
259 |
|
//Kender ikke den oprindelige vej |
260 |
|
continue; |
261 |
|
} |
262 |
|
|
263 |
|
Long aliasIdent = postnrVeje.get(vasketAlias); |
264 |
|
|
265 |
|
if (aliasIdent == null) { //Vi kender ikke denne variant af vejnavnet |
266 |
|
postnrVeje.put(vasketAlias, gadeident); |
267 |
|
vaskCount++; |
268 |
|
} |
269 |
|
|
270 |
|
} |
271 |
|
System.out.println("Anvendte " + vaskCount + " aliaser fra databasen"); |
272 |
|
|
273 |
|
|
274 |
|
//////////////////////////////////////////////////////////////////////////////////////// |
275 |
|
long start3 = System.currentTimeMillis(); |
276 |
|
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
277 |
|
System.out.println("Build -- stage 3 udvidet dækning"); |
278 |
|
|
279 |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
280 |
for (ExtendedBean eb : extDao) { |
for (ExtendedBean eb : extDao) { |
331 |
idAddressMap = null; |
idAddressMap = null; |
332 |
|
|
333 |
////////////////////////////////////////////////////////////////////////////////////// |
////////////////////////////////////////////////////////////////////////////////////// |
334 |
long start3 = System.currentTimeMillis(); |
long start4 = System.currentTimeMillis(); |
335 |
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
336 |
System.out.println("Build -- stage 3 - 100pct"); |
System.out.println("Build -- stage 4 - 100pct"); |
337 |
|
|
338 |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
339 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
360 |
|
|
361 |
//////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////// |
362 |
long stop = System.currentTimeMillis(); |
long stop = System.currentTimeMillis(); |
363 |
System.out.println("Build, stage3 elapsed: " + (stop-start3) ); |
System.out.println("Build, stage3 elapsed: " + (stop-start4) ); |
364 |
System.out.println("Build -- Gathering statistics"); |
System.out.println("Build -- Gathering statistics"); |
365 |
|
|
366 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
405 |
} |
} |
406 |
|
|
407 |
|
|
|
private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) { |
|
|
for(String vej : postnrVeje.keySet()) { |
|
|
if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) { |
|
|
System.out.println("Levenstein: " + vasketVejnavn + "->" + vej); |
|
|
return vej; |
|
|
} |
|
|
} |
|
|
|
|
|
return null; |
|
|
} |
|
|
|
|
408 |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
409 |
|
|
410 |
// /////////////////////////////////////////////////////////////////// |
// /////////////////////////////////////////////////////////////////// |
483 |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
484 |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
485 |
|
|
486 |
|
aliasSet.add(vejnavn.replace("dronning", "dr") ); |
487 |
|
aliasSet.add(vejnavn.replace("dr.", "dronning") ); |
488 |
|
aliasSet.add(vejnavn.replace("dr ", "dronning") ); |
489 |
|
|
490 |
|
aliasSet.add(vejnavn.replace("kng", "kongen") ); |
491 |
|
aliasSet.add(vejnavn.replace("kongen", "kng") ); |
492 |
|
|
493 |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
494 |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
495 |
|
|
522 |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
523 |
|
|
524 |
|
|
525 |
|
// fornavn forkortelser |
526 |
|
aliasSet.add(vejnavn.replace("john", "j") ); |
527 |
|
aliasSet.add(vejnavn.replace("thomas", "th") ); |
528 |
|
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
529 |
|
|
530 |
|
|
531 |
|
// Romertal |
532 |
|
aliasSet.add(vejnavn.replace("1", "i") ); |
533 |
|
aliasSet.add(vejnavn.replace("i", "1") ); |
534 |
|
|
535 |
|
aliasSet.add(vejnavn.replace("2", "ii") ); |
536 |
|
aliasSet.add(vejnavn.replace("ii", "2") ); |
537 |
|
|
538 |
|
aliasSet.add(vejnavn.replace("3", "iii") ); |
539 |
|
aliasSet.add(vejnavn.replace("iii", "3") ); |
540 |
|
|
541 |
|
aliasSet.add(vejnavn.replace("4", "iv") ); |
542 |
|
aliasSet.add(vejnavn.replace("iv", "4") ); |
543 |
|
|
544 |
|
aliasSet.add(vejnavn.replace("5", "v") ); |
545 |
|
aliasSet.add(vejnavn.replace("v", "5") ); |
546 |
|
|
547 |
|
aliasSet.add(vejnavn.replace("6", "vi") ); |
548 |
|
aliasSet.add(vejnavn.replace("vi", "6") ); |
549 |
|
|
550 |
|
aliasSet.add(vejnavn.replace("7", "vii") ); |
551 |
|
aliasSet.add(vejnavn.replace("vii", "7") ); |
552 |
|
|
553 |
|
aliasSet.add(vejnavn.replace("8", "viii") ); |
554 |
|
aliasSet.add(vejnavn.replace("viii", "8") ); |
555 |
|
|
556 |
|
aliasSet.add(vejnavn.replace("9", "ix") ); |
557 |
|
aliasSet.add(vejnavn.replace("ix", "9") ); |
558 |
|
|
559 |
|
aliasSet.add(vejnavn.replace("10", "x") ); |
560 |
|
aliasSet.add(vejnavn.replace("x", "10") ); |
561 |
|
|
562 |
|
|
563 |
//alternative måder at stave vej/gade/alle |
//alternative måder at stave vej/gade/alle |
564 |
aliasSet.add(vejnavn.replace("vej", "ve") ); |
aliasSet.add(vejnavn.replace("vej", "ve") ); |
565 |
aliasSet.add(vejnavn.replace("vej", "vj") ); |
aliasSet.add(vejnavn.replace("vej", "vj") ); |
566 |
aliasSet.add(vejnavn.replace("vej", "v") ); |
aliasSet.add(vejnavn.replace("vej", "v") ); |
567 |
|
aliasSet.add(vejnavn.replace("vej", "vejen") ); |
568 |
|
aliasSet.add(vejnavn.replace("vejen", "vej") ); |
569 |
|
|
570 |
aliasSet.add(vejnavn.replace("alle", "all") ); |
aliasSet.add(vejnavn.replace("alle", "all") ); |
571 |
aliasSet.add(vejnavn.replace("allé", "all") ); |
aliasSet.add(vejnavn.replace("allé", "all") ); |
574 |
|
|
575 |
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
576 |
|
|
577 |
|
aliasSet.add(vejnavn.replace("plads", "pl") ); |
578 |
|
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
579 |
|
|
580 |
|
|
581 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
582 |
|
|