12 |
import java.util.Set; |
import java.util.Set; |
13 |
import java.util.concurrent.ConcurrentHashMap; |
import java.util.concurrent.ConcurrentHashMap; |
14 |
|
|
15 |
import dk.daoas.daoadresseservice.AddressUtils.SplitResult; |
import org.apache.commons.lang3.StringUtils; |
16 |
|
|
17 |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
18 |
import dk.daoas.daoadresseservice.beans.Address; |
import dk.daoas.daoadresseservice.beans.Address; |
19 |
|
import dk.daoas.daoadresseservice.beans.AliasBean; |
20 |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
21 |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
22 |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
33 |
|
|
34 |
private Map<String,Long> helperCache; |
private Map<String,Long> helperCache; |
35 |
|
|
36 |
private DataStatisticsBean stats = new DataStatisticsBean(); |
private DataStatisticsBean stats = new DataStatisticsBean(); |
37 |
|
|
38 |
|
ServiceConfig config; |
39 |
|
|
40 |
|
public AdressSearch(ServiceConfig config) { |
41 |
|
this.config = config; |
42 |
|
} |
43 |
|
|
44 |
|
|
45 |
public SearchResult search(ServiceConfig config, String postnrStr, String adresse) { |
public SearchResult search(String postnrStr, String adresse) { |
46 |
|
|
47 |
|
SearchResult result = new SearchResult(); |
48 |
|
|
49 |
int postnr=0; |
int postnr=0; |
50 |
boolean google = false; |
|
|
boolean osm = false; |
|
51 |
String helperSearchKey = ""; |
String helperSearchKey = ""; |
52 |
|
|
53 |
try { |
try { |
54 |
postnr = Integer.parseInt(postnrStr); |
postnr = Integer.parseInt(postnrStr); |
55 |
} catch (Exception E) { |
} catch (Exception E) { |
56 |
return new SearchResult(Status.ERROR_UNKNOWN_POSTAL); |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
57 |
|
return result; |
58 |
} |
} |
59 |
|
|
60 |
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr); |
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr); |
61 |
|
|
62 |
if (postnrVeje == null) { |
if (postnrVeje == null) { |
63 |
return new SearchResult(Status.ERROR_UNKNOWN_POSTAL); |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
64 |
|
return result; |
65 |
} |
} |
66 |
|
|
67 |
|
|
68 |
SplitResult split = AddressUtils.splitAdresse(adresse); |
result.splitResult = AddressUtils.splitAdresse(adresse); |
69 |
String vasketVejnavn = AddressUtils.vaskVejnavn( split.vej ); |
|
70 |
|
|
71 |
if (split.husnr.length() == 0) { |
if (result.splitResult.husnr.length() == 0) { |
72 |
return new SearchResult(Status.ERROR_MISSING_HOUSENUMBER); |
result.status = Status.ERROR_MISSING_HOUSENUMBER; |
73 |
|
return result; |
74 |
} |
} |
75 |
|
|
76 |
|
String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej ); |
77 |
|
|
78 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Long gadeident = postnrVeje.get(vasketVejnavn); |
79 |
|
|
80 |
|
|
83 |
gadeident = helperCache.get(helperSearchKey); |
gadeident = helperCache.get(helperSearchKey); |
84 |
} |
} |
85 |
|
|
86 |
|
if (gadeident == null) { |
87 |
|
String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje); |
88 |
|
if (best != null) { |
89 |
|
result.levenshtein = true; |
90 |
|
gadeident = postnrVeje.get(best); |
91 |
|
} |
92 |
|
} |
93 |
|
|
94 |
|
|
95 |
|
// Brug OpenStreetMap før vi prøver google |
96 |
|
// For google har en request limit, det har OSM ikke! |
97 |
if ( gadeident == null) { |
if ( gadeident == null) { |
98 |
if (config.useGoogle) { |
if (config.useOpenStreetMaps) { |
99 |
String googleVej = GeocodeHelper.googleHelper(config, postnr, split.vej ); |
result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej ); |
100 |
google = true; |
result.osm = true; |
101 |
|
|
102 |
if (googleVej != null) { |
gadeident = helperWrapper(result.osmVej, postnrVeje, helperSearchKey); |
|
String googleVasket = AddressUtils.vaskVejnavn( googleVej ); |
|
|
gadeident = postnrVeje.get(googleVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
103 |
} |
} |
104 |
} |
} |
105 |
|
|
106 |
if ( gadeident == null) { |
if ( gadeident == null) { |
107 |
if (config.useOpenStreetMaps) { |
if (config.useGoogle) { |
108 |
String osmVej = GeocodeHelper.openstreetmapHelper(postnr, split.vej ); |
result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej ); |
109 |
osm = true; |
result.google = true; |
110 |
|
|
111 |
if (osmVej != null) { |
gadeident = helperWrapper(result.googleVej, postnrVeje, helperSearchKey); |
|
String osmVasket = AddressUtils.vaskVejnavn( osmVej ); |
|
|
gadeident = postnrVeje.get(osmVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
112 |
} |
} |
113 |
} |
} |
114 |
|
|
115 |
if (gadeident == null) { |
|
116 |
return new SearchResult(Status.ERROR_UNKNOWN_STREETNAME); |
|
117 |
|
if (gadeident == null) { |
118 |
|
result.status = Status.ERROR_UNKNOWN_STREETNAME; |
119 |
|
return result; |
120 |
} |
} |
121 |
|
|
122 |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); //Denne søgning må ikke fejle |
result.gadeident = gadeident; |
123 |
|
|
124 |
|
|
125 |
|
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
126 |
|
if (gade == null) { //Denne søgning må ikke fejle |
127 |
|
result.status = Status.ERROR_INTERNAL; |
128 |
|
return result; |
129 |
|
} |
130 |
|
|
131 |
|
|
132 |
String husnrSearch = "" + split.husnr + split.litra; |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
133 |
Address addr = gade.get(husnrSearch); |
Address addr = gade.get(husnrSearch); |
134 |
|
|
135 |
if (addr == null) { |
if (addr == null) { |
136 |
return new SearchResult(Status.ERROR_UNKNOWN_ADDRESSPOINT); |
result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; |
137 |
|
return result; |
138 |
} |
} |
139 |
|
|
140 |
|
result.address = addr; |
141 |
|
|
142 |
|
|
143 |
|
if ( StringUtils.equals(addr.distributor, "LUKKET") ) { |
144 |
|
result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ? |
145 |
|
return result; |
146 |
|
} |
147 |
|
|
148 |
if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) { |
if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) { |
149 |
return new SearchResult(Status.STATUS_NOT_COVERED); |
result.status = Status.STATUS_NOT_COVERED; |
150 |
|
return result; |
151 |
} |
} |
152 |
|
|
153 |
|
|
154 |
if (addr.distributor.equals("LUKKET")) { |
result.status = Status.STATUS_OK; |
155 |
return new SearchResult(Status.STATUS_NOT_COVERED); //Skal vi have en special status til Lukkede adresser ? |
|
156 |
} |
return result; |
157 |
|
} |
158 |
|
|
159 |
|
private Long helperWrapper(String vej, Map<String,Long> postnrVeje, String helperSearchKey) { |
160 |
|
if (vej == null) |
161 |
|
return null; |
162 |
|
|
163 |
|
String vejVasket = AddressUtils.vaskVejnavn( vej ); |
164 |
|
Long gadeident = postnrVeje.get(vejVasket); |
165 |
|
|
166 |
|
if (gadeident != null) { |
167 |
|
helperCache.put(helperSearchKey, gadeident); |
168 |
|
} |
169 |
|
return gadeident; |
170 |
|
|
|
SearchResult res = new SearchResult(addr); |
|
|
res.google = google; |
|
|
res.osm = osm; |
|
|
return res; |
|
171 |
} |
} |
172 |
|
|
173 |
|
|
174 |
|
|
175 |
|
|
176 |
|
|
177 |
public void buildSearchStructures() throws SQLException{ |
public void buildSearchStructures() throws SQLException{ |
178 |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
200 |
|
|
201 |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
202 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Long gadeident = postnrVeje.get(vasketVejnavn); |
203 |
if (gadeident == null) { |
if (gadeident == null) { |
204 |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
205 |
|
|
206 |
|
gadeident = a.gadeid; |
207 |
|
|
208 |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
209 |
for(String alias : aliaser) { |
for(String alias : aliaser) { |
210 |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
211 |
postnrVeje.put(vasketAlias, a.gadeid); |
postnrVeje.put(vasketAlias, gadeident); |
212 |
} |
} |
|
|
|
213 |
} |
} |
214 |
|
|
215 |
Map<String, Address> gade = searchGadeidentAdresser.get(a.gadeid); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
216 |
if (gade == null) { |
if (gade == null) { |
217 |
gade = new HashMap<String, Address>(); |
gade = new HashMap<String, Address>(); |
218 |
searchGadeidentAdresser.put(a.gadeid, gade); |
searchGadeidentAdresser.put(gadeident, gade); |
219 |
} |
} |
220 |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
221 |
gade.put(husnrSearch, a); |
gade.put(husnrSearch, a); |
222 |
} |
} |
223 |
|
|
|
|
|
224 |
//////////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////////// |
225 |
long start2 = System.currentTimeMillis(); |
long start2 = System.currentTimeMillis(); |
226 |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
227 |
System.out.println("Build -- stage 2 udvidet dækning"); |
System.out.println("Build -- stage 2 alias tabel"); |
228 |
|
|
229 |
|
int vaskCount = 0; |
230 |
|
List<AliasBean> aliasList = DatabaseLayer.getAliasList(); |
231 |
|
for (AliasBean alias : aliasList) { |
232 |
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
233 |
|
|
234 |
|
if (postnrVeje == null) { |
235 |
|
//Burde ikke kunne ske - men better safe than sorry |
236 |
|
continue; |
237 |
|
} |
238 |
|
|
239 |
|
String vasketVej = AddressUtils.vaskVejnavn(alias.vejnavn); |
240 |
|
String vasketAlias = AddressUtils.vaskVejnavn(alias.aliasVejnavn); |
241 |
|
|
242 |
|
Long gadeident = postnrVeje.get(vasketVej); |
243 |
|
if (gadeident == null) { |
244 |
|
//Kender ikke den oprindelige vej |
245 |
|
continue; |
246 |
|
} |
247 |
|
|
248 |
|
Long aliasIdent = postnrVeje.get(vasketAlias); |
249 |
|
|
250 |
|
if (aliasIdent == null) { //Vi kender ikke denne variant af vejnavnet |
251 |
|
postnrVeje.put(vasketAlias, gadeident); |
252 |
|
vaskCount++; |
253 |
|
} |
254 |
|
|
255 |
|
} |
256 |
|
System.out.println("Anvendte " + vaskCount + " aliaser fra databasen"); |
257 |
|
|
258 |
|
|
259 |
|
//////////////////////////////////////////////////////////////////////////////////////// |
260 |
|
long start3 = System.currentTimeMillis(); |
261 |
|
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
262 |
|
System.out.println("Build -- stage 3 udvidet dækning"); |
263 |
|
|
264 |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
265 |
for (ExtendedBean eb : extDao) { |
for (ExtendedBean eb : extDao) { |
316 |
idAddressMap = null; |
idAddressMap = null; |
317 |
|
|
318 |
////////////////////////////////////////////////////////////////////////////////////// |
////////////////////////////////////////////////////////////////////////////////////// |
319 |
long start3 = System.currentTimeMillis(); |
long start4 = System.currentTimeMillis(); |
320 |
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
321 |
System.out.println("Build -- stage 3 - 100pct"); |
System.out.println("Build -- stage 4 - 100pct"); |
322 |
|
|
323 |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
324 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
345 |
|
|
346 |
//////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////// |
347 |
long stop = System.currentTimeMillis(); |
long stop = System.currentTimeMillis(); |
348 |
System.out.println("Build, stage3 elapsed: " + (stop-start3) ); |
System.out.println("Build, stage3 elapsed: " + (stop-start4) ); |
349 |
System.out.println("Build -- Gathering statistics"); |
System.out.println("Build -- Gathering statistics"); |
350 |
|
|
351 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
390 |
} |
} |
391 |
|
|
392 |
|
|
393 |
|
private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) { |
394 |
|
for(String vej : postnrVeje.keySet()) { |
395 |
|
if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) { |
396 |
|
System.out.println("Levenstein: " + vasketVejnavn + "->" + vej); |
397 |
|
return vej; |
398 |
|
} |
399 |
|
} |
400 |
|
|
401 |
|
return null; |
402 |
|
} |
403 |
|
|
404 |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
405 |
|
|
406 |
// /////////////////////////////////////////////////////////////////// |
// /////////////////////////////////////////////////////////////////// |
479 |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
480 |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
481 |
|
|
482 |
|
aliasSet.add(vejnavn.replace("dronning", "dr") ); |
483 |
|
aliasSet.add(vejnavn.replace("dr.", "dronning") ); |
484 |
|
aliasSet.add(vejnavn.replace("dr ", "dronning") ); |
485 |
|
|
486 |
|
aliasSet.add(vejnavn.replace("kng", "kongen") ); |
487 |
|
aliasSet.add(vejnavn.replace("kongen", "kng") ); |
488 |
|
|
489 |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
490 |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
491 |
|
|
515 |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
516 |
|
|
517 |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
518 |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
519 |
|
|
520 |
|
aliasSet.add(vejnavn.replace("john", "j") ); //john f kennedy -> j f kennedy |
521 |
|
|
522 |
|
// Romertal |
523 |
|
aliasSet.add(vejnavn.replace("1", "i") ); |
524 |
|
aliasSet.add(vejnavn.replace("i", "1") ); |
525 |
|
|
526 |
|
aliasSet.add(vejnavn.replace("2", "ii") ); |
527 |
|
aliasSet.add(vejnavn.replace("ii", "2") ); |
528 |
|
|
529 |
|
aliasSet.add(vejnavn.replace("3", "iii") ); |
530 |
|
aliasSet.add(vejnavn.replace("iii", "3") ); |
531 |
|
|
532 |
|
aliasSet.add(vejnavn.replace("4", "iv") ); |
533 |
|
aliasSet.add(vejnavn.replace("iv", "4") ); |
534 |
|
|
535 |
|
aliasSet.add(vejnavn.replace("5", "v") ); |
536 |
|
aliasSet.add(vejnavn.replace("v", "5") ); |
537 |
|
|
538 |
|
aliasSet.add(vejnavn.replace("6", "vi") ); |
539 |
|
aliasSet.add(vejnavn.replace("vi", "6") ); |
540 |
|
|
541 |
|
aliasSet.add(vejnavn.replace("7", "vii") ); |
542 |
|
aliasSet.add(vejnavn.replace("vii", "7") ); |
543 |
|
|
544 |
|
aliasSet.add(vejnavn.replace("8", "viii") ); |
545 |
|
aliasSet.add(vejnavn.replace("viii", "8") ); |
546 |
|
|
547 |
|
aliasSet.add(vejnavn.replace("9", "ix") ); |
548 |
|
aliasSet.add(vejnavn.replace("ix", "9") ); |
549 |
|
|
550 |
|
aliasSet.add(vejnavn.replace("10", "x") ); |
551 |
|
aliasSet.add(vejnavn.replace("x", "10") ); |
552 |
|
|
553 |
|
|
554 |
|
//alternative måder at stave vej/gade/alle |
555 |
|
aliasSet.add(vejnavn.replace("vej", "ve") ); |
556 |
|
aliasSet.add(vejnavn.replace("vej", "vj") ); |
557 |
|
aliasSet.add(vejnavn.replace("vej", "v") ); |
558 |
|
aliasSet.add(vejnavn.replace("vej", "vejen") ); |
559 |
|
aliasSet.add(vejnavn.replace("vejen", "vej") ); |
560 |
|
|
561 |
|
aliasSet.add(vejnavn.replace("alle", "all") ); |
562 |
|
aliasSet.add(vejnavn.replace("allé", "all") ); |
563 |
|
aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo |
564 |
|
aliasSet.add(vejnavn.replace("allé", "allú") ); |
565 |
|
|
566 |
|
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
567 |
|
|
568 |
|
aliasSet.add(vejnavn.replace("plads", "pl") ); |
569 |
|
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
570 |
|
|
571 |
|
|
572 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
573 |
|
|