12 |
import java.util.Set; |
import java.util.Set; |
13 |
import java.util.concurrent.ConcurrentHashMap; |
import java.util.concurrent.ConcurrentHashMap; |
14 |
|
|
15 |
import dk.daoas.daoadresseservice.AddressUtils.SplitResult; |
import org.apache.commons.lang3.StringUtils; |
16 |
|
|
17 |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
18 |
import dk.daoas.daoadresseservice.beans.Address; |
import dk.daoas.daoadresseservice.beans.Address; |
19 |
|
import dk.daoas.daoadresseservice.beans.AliasBean; |
20 |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
21 |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
22 |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
23 |
|
import dk.daoas.daoadresseservice.beans.SearchRequest; |
24 |
import dk.daoas.daoadresseservice.beans.SearchResult; |
import dk.daoas.daoadresseservice.beans.SearchResult; |
25 |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
26 |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
27 |
|
|
28 |
public class AdressSearch { |
public class AddressSearch { |
29 |
|
|
30 |
private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid; |
private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid; |
31 |
private Map<Long, Map<String,Address>> searchGadeidentAdresser; |
private Map<Long, Map<String,Address>> searchGadeidentAdresser; |
34 |
|
|
35 |
private Map<String,Long> helperCache; |
private Map<String,Long> helperCache; |
36 |
|
|
37 |
private DataStatisticsBean stats = new DataStatisticsBean(); |
private DataStatisticsBean stats = new DataStatisticsBean(); |
38 |
|
|
39 |
|
ServiceConfig config; |
40 |
|
|
41 |
|
StreetnameHelper levenshteinHelper; |
42 |
|
StreetnameHelper googleHelper; |
43 |
|
StreetnameHelper osmHelper; |
44 |
|
|
45 |
|
|
46 |
|
public AddressSearch(ServiceConfig config) { |
47 |
|
this.config = config; |
48 |
|
|
49 |
|
levenshteinHelper = new LevenshteinStreetnameHelper( this ); |
50 |
|
googleHelper = new GoogleStreetnameHelper( config ); |
51 |
|
osmHelper = new OSMStreetnameHelper( config ); |
52 |
|
} |
53 |
|
|
54 |
|
|
55 |
public SearchResult search(ServiceConfig config, String postnrStr, String adresse) { |
public SearchResult search(String postnrStr, String adresse) { |
56 |
|
SearchRequest request = new SearchRequest(); |
57 |
|
SearchResult result = new SearchResult(); |
58 |
|
|
59 |
int postnr=0; |
|
|
boolean google = false; |
|
|
boolean osm = false; |
|
60 |
String helperSearchKey = ""; |
String helperSearchKey = ""; |
61 |
|
|
62 |
try { |
try { |
63 |
postnr = Integer.parseInt(postnrStr); |
request.postnr = Integer.parseInt(postnrStr); |
64 |
} catch (Exception E) { |
} catch (Exception E) { |
65 |
return new SearchResult(Status.ERROR_UNKNOWN_POSTAL); |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
66 |
|
return result; |
67 |
} |
} |
68 |
|
|
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr); |
|
69 |
|
|
70 |
if (postnrVeje == null) { |
request.streetNames = searchPostnrVejnavnGadeid.get(request.postnr); |
71 |
return new SearchResult(Status.ERROR_UNKNOWN_POSTAL); |
|
72 |
|
if (request.streetNames == null) { |
73 |
|
result.status = Status.ERROR_UNKNOWN_POSTAL; |
74 |
|
return result; |
75 |
} |
} |
76 |
|
|
77 |
|
|
78 |
SplitResult split = AddressUtils.splitAdresse(adresse); |
result.splitResult = AddressUtils.splitAdresse(adresse); |
79 |
String vasketVejnavn = AddressUtils.vaskVejnavn( split.vej ); |
request.vejnavn = result.splitResult.vej; |
80 |
|
|
81 |
if (split.husnr.length() == 0) { |
|
82 |
return new SearchResult(Status.ERROR_MISSING_HOUSENUMBER); |
|
83 |
|
if (result.splitResult.husnr.length() == 0) { |
84 |
|
result.status = Status.ERROR_MISSING_HOUSENUMBER; |
85 |
|
return result; |
86 |
} |
} |
87 |
|
|
88 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
request.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
89 |
|
|
90 |
|
Long gadeident = request.streetNames.get(request.vasketVejnavn); |
91 |
|
|
92 |
|
|
93 |
if ( gadeident == null) { |
if ( gadeident == null) { |
94 |
helperSearchKey = "" + postnr + "/" + vasketVejnavn; |
helperSearchKey = "" + request.postnr + "/" + request.vasketVejnavn; |
95 |
gadeident = helperCache.get(helperSearchKey); |
gadeident = helperCache.get(helperSearchKey); |
96 |
} |
} |
97 |
|
|
98 |
|
if (gadeident == null) { |
99 |
|
String vej = levenshteinHelper.proposeStreetName(request, result); |
100 |
|
if (vej != null) { |
101 |
|
gadeident = request.streetNames.get(vej); |
102 |
|
} |
103 |
|
} |
104 |
|
|
105 |
|
|
106 |
|
// Brug OpenStreetMap før vi prøver google |
107 |
|
// For google har en request limit, det har OSM ikke! |
108 |
if ( gadeident == null) { |
if ( gadeident == null) { |
109 |
if (config.useGoogle) { |
String vej = osmHelper.proposeStreetName(request, result); |
110 |
String googleVej = GeocodeHelper.googleHelper(config, postnr, split.vej ); |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
google = true; |
|
|
|
|
|
if (googleVej != null) { |
|
|
String googleVasket = AddressUtils.vaskVejnavn( googleVej ); |
|
|
gadeident = postnrVeje.get(googleVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
|
} |
|
111 |
} |
} |
112 |
|
|
113 |
if ( gadeident == null) { |
if ( gadeident == null) { |
114 |
if (config.useOpenStreetMaps) { |
String vej = googleHelper.proposeStreetName(request, result); |
115 |
String osmVej = GeocodeHelper.openstreetmapHelper(postnr, split.vej ); |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
osm = true; |
|
|
|
|
|
if (osmVej != null) { |
|
|
String osmVasket = AddressUtils.vaskVejnavn( osmVej ); |
|
|
gadeident = postnrVeje.get(osmVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
|
} |
|
116 |
} |
} |
117 |
|
|
118 |
if (gadeident == null) { |
|
119 |
return new SearchResult(Status.ERROR_UNKNOWN_STREETNAME); |
|
120 |
|
if (gadeident == null) { |
121 |
|
result.status = Status.ERROR_UNKNOWN_STREETNAME; |
122 |
|
return result; |
123 |
|
} |
124 |
|
|
125 |
|
result.gadeident = gadeident; |
126 |
|
|
127 |
|
|
128 |
|
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
129 |
|
if (gade == null) { //Denne søgning må ikke fejle |
130 |
|
result.status = Status.ERROR_INTERNAL; |
131 |
|
return result; |
132 |
} |
} |
133 |
|
|
|
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); //Denne søgning må ikke fejle |
|
134 |
|
|
135 |
|
//Kunne evt klares med Iterables.get fra Guava/Collections |
136 |
|
Address firstAddress = gade.values().iterator().next(); |
137 |
|
result.vej = firstAddress.vejnavn; |
138 |
|
|
139 |
String husnrSearch = "" + split.husnr + split.litra; |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
140 |
Address addr = gade.get(husnrSearch); |
Address addr = gade.get(husnrSearch); |
141 |
|
|
142 |
if (addr == null) { |
if (addr == null) { |
143 |
return new SearchResult(Status.ERROR_UNKNOWN_ADDRESSPOINT); |
result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT; |
144 |
|
return result; |
145 |
} |
} |
146 |
|
|
147 |
|
result.address = addr; |
148 |
|
|
149 |
|
|
150 |
|
if ( StringUtils.equals(addr.distributor, "LUKKET") ) { |
151 |
|
result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ? |
152 |
|
return result; |
153 |
|
} |
154 |
|
|
155 |
if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) { |
if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) { |
156 |
return new SearchResult(Status.STATUS_NOT_COVERED); |
result.status = Status.STATUS_NOT_COVERED; |
157 |
|
return result; |
158 |
} |
} |
159 |
|
|
160 |
|
|
161 |
if (addr.distributor.equals("LUKKET")) { |
result.status = Status.STATUS_OK; |
162 |
return new SearchResult(Status.STATUS_NOT_COVERED); //Skal vi have en special status til Lukkede adresser ? |
|
163 |
} |
return result; |
164 |
|
} |
165 |
|
|
166 |
|
private Long helperWrapper(String vej, Map<String,Long> postnrVeje, String helperSearchKey) { |
167 |
|
if (vej == null) |
168 |
|
return null; |
169 |
|
|
170 |
|
String vejVasket = AddressUtils.vaskVejnavn( vej ); |
171 |
|
Long gadeident = postnrVeje.get(vejVasket); |
172 |
|
|
173 |
|
if (gadeident != null) { |
174 |
|
helperCache.put(helperSearchKey, gadeident); |
175 |
|
} |
176 |
|
return gadeident; |
177 |
|
|
|
SearchResult res = new SearchResult(addr); |
|
|
res.google = google; |
|
|
res.osm = osm; |
|
|
return res; |
|
178 |
} |
} |
179 |
|
|
180 |
|
public Map<String,Long> getStretsByPostal(int zip) { |
181 |
|
return searchPostnrVejnavnGadeid.get(zip); |
182 |
|
} |
183 |
|
|
184 |
|
|
185 |
|
|
186 |
public void buildSearchStructures() throws SQLException{ |
public void buildSearchStructures() throws SQLException{ |
187 |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
209 |
|
|
210 |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
211 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Long gadeident = postnrVeje.get(vasketVejnavn); |
212 |
if (gadeident == null) { |
if (gadeident == null) { |
213 |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
214 |
|
|
215 |
|
gadeident = a.gadeid; |
216 |
|
|
217 |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
218 |
for(String alias : aliaser) { |
for(String alias : aliaser) { |
219 |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
220 |
postnrVeje.put(vasketAlias, a.gadeid); |
postnrVeje.put(vasketAlias, gadeident); |
221 |
} |
} |
|
|
|
222 |
} |
} |
223 |
|
|
224 |
Map<String, Address> gade = searchGadeidentAdresser.get(a.gadeid); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
225 |
if (gade == null) { |
if (gade == null) { |
226 |
gade = new HashMap<String, Address>(); |
gade = new HashMap<String, Address>(); |
227 |
searchGadeidentAdresser.put(a.gadeid, gade); |
searchGadeidentAdresser.put(gadeident, gade); |
228 |
} |
} |
229 |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
230 |
gade.put(husnrSearch, a); |
gade.put(husnrSearch, a); |
231 |
} |
} |
232 |
|
|
|
|
|
233 |
//////////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////////// |
234 |
long start2 = System.currentTimeMillis(); |
long start2 = System.currentTimeMillis(); |
235 |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
236 |
System.out.println("Build -- stage 2 udvidet dækning"); |
System.out.println("Build -- stage 2 alias tabel"); |
237 |
|
|
238 |
|
int vaskCount = 0; |
239 |
|
List<AliasBean> aliasList = DatabaseLayer.getAliasList(); |
240 |
|
for (AliasBean alias : aliasList) { |
241 |
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
242 |
|
|
243 |
|
if (postnrVeje == null) { |
244 |
|
//Burde ikke kunne ske - men better safe than sorry |
245 |
|
continue; |
246 |
|
} |
247 |
|
|
248 |
|
String vasketVej = AddressUtils.vaskVejnavn(alias.vejnavn); |
249 |
|
String vasketAlias = AddressUtils.vaskVejnavn(alias.aliasVejnavn); |
250 |
|
|
251 |
|
Long gadeident = postnrVeje.get(vasketVej); |
252 |
|
if (gadeident == null) { |
253 |
|
//Kender ikke den oprindelige vej |
254 |
|
continue; |
255 |
|
} |
256 |
|
|
257 |
|
Long aliasIdent = postnrVeje.get(vasketAlias); |
258 |
|
|
259 |
|
if (aliasIdent == null) { //Vi kender ikke denne variant af vejnavnet |
260 |
|
postnrVeje.put(vasketAlias, gadeident); |
261 |
|
vaskCount++; |
262 |
|
} |
263 |
|
|
264 |
|
} |
265 |
|
System.out.println("Anvendte " + vaskCount + " aliaser fra databasen"); |
266 |
|
|
267 |
|
|
268 |
|
//////////////////////////////////////////////////////////////////////////////////////// |
269 |
|
long start3 = System.currentTimeMillis(); |
270 |
|
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
271 |
|
System.out.println("Build -- stage 3 udvidet dækning"); |
272 |
|
|
273 |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
274 |
for (ExtendedBean eb : extDao) { |
for (ExtendedBean eb : extDao) { |
325 |
idAddressMap = null; |
idAddressMap = null; |
326 |
|
|
327 |
////////////////////////////////////////////////////////////////////////////////////// |
////////////////////////////////////////////////////////////////////////////////////// |
328 |
long start3 = System.currentTimeMillis(); |
long start4 = System.currentTimeMillis(); |
329 |
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
330 |
System.out.println("Build -- stage 3 - 100pct"); |
System.out.println("Build -- stage 4 - 100pct"); |
331 |
|
|
332 |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
333 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
354 |
|
|
355 |
//////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////// |
356 |
long stop = System.currentTimeMillis(); |
long stop = System.currentTimeMillis(); |
357 |
System.out.println("Build, stage3 elapsed: " + (stop-start3) ); |
System.out.println("Build, stage3 elapsed: " + (stop-start4) ); |
358 |
System.out.println("Build -- Gathering statistics"); |
System.out.println("Build -- Gathering statistics"); |
359 |
|
|
360 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
477 |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
478 |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
479 |
|
|
480 |
|
aliasSet.add(vejnavn.replace("dronning", "dr") ); |
481 |
|
aliasSet.add(vejnavn.replace("dr.", "dronning") ); |
482 |
|
aliasSet.add(vejnavn.replace("dr ", "dronning") ); |
483 |
|
|
484 |
|
aliasSet.add(vejnavn.replace("kng", "kongen") ); |
485 |
|
aliasSet.add(vejnavn.replace("kongen", "kng") ); |
486 |
|
|
487 |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
488 |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
489 |
|
|
513 |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
514 |
|
|
515 |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
516 |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
517 |
|
|
518 |
|
|
519 |
|
// fornavn forkortelser |
520 |
|
aliasSet.add(vejnavn.replace("john", "j") ); |
521 |
|
aliasSet.add(vejnavn.replace("thomas", "th") ); |
522 |
|
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
523 |
|
|
524 |
|
|
525 |
|
// Romertal |
526 |
|
aliasSet.add(vejnavn.replace("1", "i") ); |
527 |
|
aliasSet.add(vejnavn.replace("i", "1") ); |
528 |
|
|
529 |
|
aliasSet.add(vejnavn.replace("2", "ii") ); |
530 |
|
aliasSet.add(vejnavn.replace("ii", "2") ); |
531 |
|
|
532 |
|
aliasSet.add(vejnavn.replace("3", "iii") ); |
533 |
|
aliasSet.add(vejnavn.replace("iii", "3") ); |
534 |
|
|
535 |
|
aliasSet.add(vejnavn.replace("4", "iv") ); |
536 |
|
aliasSet.add(vejnavn.replace("iv", "4") ); |
537 |
|
|
538 |
|
aliasSet.add(vejnavn.replace("5", "v") ); |
539 |
|
aliasSet.add(vejnavn.replace("v", "5") ); |
540 |
|
|
541 |
|
aliasSet.add(vejnavn.replace("6", "vi") ); |
542 |
|
aliasSet.add(vejnavn.replace("vi", "6") ); |
543 |
|
|
544 |
|
aliasSet.add(vejnavn.replace("7", "vii") ); |
545 |
|
aliasSet.add(vejnavn.replace("vii", "7") ); |
546 |
|
|
547 |
|
aliasSet.add(vejnavn.replace("8", "viii") ); |
548 |
|
aliasSet.add(vejnavn.replace("viii", "8") ); |
549 |
|
|
550 |
|
aliasSet.add(vejnavn.replace("9", "ix") ); |
551 |
|
aliasSet.add(vejnavn.replace("ix", "9") ); |
552 |
|
|
553 |
|
aliasSet.add(vejnavn.replace("10", "x") ); |
554 |
|
aliasSet.add(vejnavn.replace("x", "10") ); |
555 |
|
|
556 |
|
|
557 |
|
//alternative måder at stave vej/gade/alle |
558 |
|
aliasSet.add(vejnavn.replace("vej", "ve") ); |
559 |
|
aliasSet.add(vejnavn.replace("vej", "vj") ); |
560 |
|
aliasSet.add(vejnavn.replace("vej", "v") ); |
561 |
|
aliasSet.add(vejnavn.replace("vej", "vejen") ); |
562 |
|
aliasSet.add(vejnavn.replace("vejen", "vej") ); |
563 |
|
|
564 |
|
aliasSet.add(vejnavn.replace("alle", "all") ); |
565 |
|
aliasSet.add(vejnavn.replace("allé", "all") ); |
566 |
|
aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo |
567 |
|
aliasSet.add(vejnavn.replace("allé", "allú") ); |
568 |
|
|
569 |
|
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
570 |
|
|
571 |
|
aliasSet.add(vejnavn.replace("plads", "pl") ); |
572 |
|
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
573 |
|
|
574 |
|
|
575 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
576 |
|
|