/[projects]/dao/DaoAdresseService/src/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Annotation of /dao/DaoAdresseService/src/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log


Revision 2389 - (hide annotations) (download)
Thu Feb 26 15:47:07 2015 UTC (9 years, 3 months ago) by torben
Original Path: dao/DaoAdresseService/src/dk/daoas/daoadresseservice/AdressSearch.java
File size: 15921 byte(s)
Rapporter brugen af levenshtein
1 torben 2267 package dk.daoas.daoadresseservice;
2    
3 torben 2274 import java.sql.SQLException;
4 torben 2339 import java.text.SimpleDateFormat;
5 torben 2332 import java.util.ArrayList;
6 torben 2333 import java.util.Collections;
7 torben 2338 import java.util.Date;
8 torben 2267 import java.util.HashMap;
9 torben 2292 import java.util.HashSet;
10 torben 2274 import java.util.List;
11     import java.util.Map;
12 torben 2292 import java.util.Set;
13 torben 2274 import java.util.concurrent.ConcurrentHashMap;
14 torben 2267
15 torben 2381 import org.apache.commons.lang3.StringUtils;
16    
17 torben 2346 import dk.daoas.daoadresseservice.admin.ServiceConfig;
18 torben 2282 import dk.daoas.daoadresseservice.beans.Address;
19 torben 2337 import dk.daoas.daoadresseservice.beans.DataStatisticsBean;
20 torben 2282 import dk.daoas.daoadresseservice.beans.ExtendedBean;
21     import dk.daoas.daoadresseservice.beans.HundredePctBean;
22     import dk.daoas.daoadresseservice.beans.SearchResult;
23     import dk.daoas.daoadresseservice.beans.SearchResult.Status;
24 torben 2274 import dk.daoas.daoadresseservice.db.DatabaseLayer;
25    
26 torben 2267 public class AdressSearch {
27    
28 torben 2332 private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;
29     private Map<Long, Map<String,Address>> searchGadeidentAdresser;
30 torben 2274
31 torben 2332 private List<Address> alleAdresser;
32 torben 2267
33 torben 2332 private Map<String,Long> helperCache;
34 torben 2267
35 torben 2350 private DataStatisticsBean stats = new DataStatisticsBean();
36 torben 2303
37 torben 2350 ServiceConfig config;
38 torben 2280
39 torben 2350 public AdressSearch(ServiceConfig config) {
40     this.config = config;
41     }
42    
43    
44     public SearchResult search(String postnrStr, String adresse) {
45 torben 2288
46 torben 2359 SearchResult result = new SearchResult();
47    
48 torben 2274 int postnr=0;
49 torben 2359
50 torben 2305 String helperSearchKey = "";
51 torben 2267
52 torben 2274 try {
53     postnr = Integer.parseInt(postnrStr);
54     } catch (Exception E) {
55 torben 2359 result.status = Status.ERROR_UNKNOWN_POSTAL;
56     return result;
57 torben 2274 }
58    
59     Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);
60    
61 torben 2267 if (postnrVeje == null) {
62 torben 2359 result.status = Status.ERROR_UNKNOWN_POSTAL;
63     return result;
64 torben 2267 }
65    
66 torben 2288
67 torben 2372 result.splitResult = AddressUtils.splitAdresse(adresse);
68 torben 2358
69 torben 2267
70 torben 2372 if (result.splitResult.husnr.length() == 0) {
71 torben 2359 result.status = Status.ERROR_MISSING_HOUSENUMBER;
72     return result;
73 torben 2274 }
74 torben 2267
75 torben 2372 String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej );
76 torben 2358
77 torben 2274 Long gadeident = postnrVeje.get(vasketVejnavn);
78 torben 2301
79 torben 2305
80 torben 2298 if ( gadeident == null) {
81 torben 2305 helperSearchKey = "" + postnr + "/" + vasketVejnavn;
82     gadeident = helperCache.get(helperSearchKey);
83 torben 2301 }
84    
85 torben 2388 if (gadeident == null) {
86     String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje);
87     if (best != null) {
88 torben 2389 result.levenshtein = true;
89 torben 2388 gadeident = postnrVeje.get(best);
90     }
91     }
92 torben 2303
93 torben 2388
94 torben 2383 // Brug OpenStreetMap før vi prøver google
95     // For google har en request limit, det har OSM ikke!
96 torben 2301 if ( gadeident == null) {
97 torben 2383 if (config.useOpenStreetMaps) {
98     result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej );
99     result.osm = true;
100 torben 2304
101 torben 2383 if (result.osmVej != null) {
102     String osmVasket = AddressUtils.vaskVejnavn( result.osmVej );
103     gadeident = postnrVeje.get(osmVasket);
104 torben 2346
105     if (gadeident != null) {
106     helperCache.put(helperSearchKey, gadeident);
107     }
108 torben 2303 }
109 torben 2300 }
110 torben 2298 }
111    
112 torben 2303 if ( gadeident == null) {
113 torben 2383 if (config.useGoogle) {
114     result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej );
115     result.google = true;
116 torben 2304
117 torben 2383 if (result.googleVej != null) {
118     String googleVasket = AddressUtils.vaskVejnavn( result.googleVej );
119     gadeident = postnrVeje.get(googleVasket);
120 torben 2346
121     if (gadeident != null) {
122     helperCache.put(helperSearchKey, gadeident);
123     }
124 torben 2303 }
125     }
126     }
127    
128 torben 2383
129    
130 torben 2359 if (gadeident == null) {
131     result.status = Status.ERROR_UNKNOWN_STREETNAME;
132     return result;
133 torben 2288 }
134 torben 2274
135 torben 2359 Map<String, Address> gade = searchGadeidentAdresser.get(gadeident);
136     if (gade == null) { //Denne søgning må ikke fejle
137     result.status = Status.ERROR_INTERNAL;
138     return result;
139     }
140 torben 2274
141    
142 torben 2372 String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra;
143 torben 2274 Address addr = gade.get(husnrSearch);
144 torben 2298
145 torben 2274 if (addr == null) {
146 torben 2359 result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT;
147     return result;
148 torben 2274 }
149 torben 2276
150 torben 2359 result.address = addr;
151    
152 torben 2381
153     if ( StringUtils.equals(addr.distributor, "LUKKET") ) {
154 torben 2359 result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ?
155     return result;
156     }
157    
158 torben 2276 if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
159 torben 2359 result.status = Status.STATUS_NOT_COVERED;
160     return result;
161 torben 2276 }
162 torben 2359
163 torben 2277
164 torben 2359 result.status = Status.STATUS_OK;
165    
166     return result;
167 torben 2267 }
168    
169 torben 2274
170     public void buildSearchStructures() throws SQLException{
171     searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();
172     searchGadeidentAdresser = new HashMap<Long, Map<String,Address>>();
173 torben 2303 helperCache = new ConcurrentHashMap<String,Long>();
174    
175 torben 2309 long start1 = System.currentTimeMillis();
176 torben 2276 System.out.println("Build -- stage 1");
177    
178 torben 2274 alleAdresser = DatabaseLayer.getAllAdresses();
179 torben 2276
180 torben 2286
181 torben 2285 /* Mapper mellem db Row ID og adresse noden */
182     Map<Integer,Address> idAddressMap = new HashMap<Integer,Address>( alleAdresser.size() );
183    
184 torben 2274 for (Address a : alleAdresser) {
185     idAddressMap.put(a.id, a);
186    
187     Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(a.postnr);
188    
189     if (postnrVeje == null) {
190     postnrVeje = new ConcurrentHashMap<String,Long>();
191     searchPostnrVejnavnGadeid.put(a.postnr, postnrVeje);
192     }
193    
194 torben 2281 String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn);
195     Long gadeident = postnrVeje.get(vasketVejnavn);
196 torben 2274 if (gadeident == null) {
197 torben 2292 //postnrVeje.put(vasketVejnavn, a.gadeid);
198    
199     Set<String> aliaser = findVejAliaser(a.vejnavn);
200     for(String alias : aliaser) {
201     String vasketAlias = AddressUtils.vaskVejnavn(alias);
202     postnrVeje.put(vasketAlias, a.gadeid);
203     }
204    
205 torben 2274 }
206    
207     Map<String, Address> gade = searchGadeidentAdresser.get(a.gadeid);
208     if (gade == null) {
209     gade = new HashMap<String, Address>();
210     searchGadeidentAdresser.put(a.gadeid, gade);
211     }
212     String husnrSearch = "" + a.husnr + a.husnrbogstav;
213 torben 2286 gade.put(husnrSearch, a);
214 torben 2276 }
215    
216    
217 torben 2279 ////////////////////////////////////////////////////////////////////////////////////////
218 torben 2309 long start2 = System.currentTimeMillis();
219     System.out.println("Build, stage1 elapsed: " + (start2-start1) );
220 torben 2279 System.out.println("Build -- stage 2 udvidet dækning");
221    
222     List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();
223 torben 2276 for (ExtendedBean eb : extDao) {
224 torben 2274
225 torben 2276 Address orgAddress = idAddressMap.get(eb.orgId);
226     if (orgAddress == null)
227     continue;
228    
229     Address targetAddress = idAddressMap.get(eb.targetId);
230     if (targetAddress == null)
231     continue;
232    
233 torben 2277 if (orgAddress.distributor != null && orgAddress.distributor.equals("LUKKET")) {
234     continue;
235     }
236    
237     if (targetAddress.distributor.equals("LUKKET")) {
238     continue;
239     }
240    
241 torben 2276 orgAddress.extTarget = targetAddress;
242     orgAddress.extAfstand = eb.afstand;
243    
244 torben 2283 boolean covered = false;
245     if (targetAddress.distributor.equals("DAO")) {
246     orgAddress.rute = calculateExtendedDaoRoute(eb,orgAddress,targetAddress);
247     if (orgAddress.rute != null) {
248     orgAddress.koreliste = targetAddress.koreliste;
249     covered = true;
250     }
251     }
252 torben 2276
253 torben 2283 if (targetAddress.distributor.equals("BK")) {
254     orgAddress.koreliste = calculateExtendedBkKoreliste(eb,orgAddress,targetAddress);
255     if (orgAddress.koreliste != null) {
256     orgAddress.rute = targetAddress.rute;
257     covered = true;
258     }
259     }
260    
261     if (covered) { //Kopier resten af felterne
262 torben 2276 orgAddress.daekningsType = DaekningsType.DAEKNING_UDVIDET;
263     orgAddress.dbkBane = targetAddress.dbkBane;
264    
265     /* Sådan gør den gamle service */
266     orgAddress.kommunekode = targetAddress.kommunekode;
267     orgAddress.vejkode = targetAddress.vejkode;
268    
269     orgAddress.distributor = targetAddress.distributor;
270     }
271 torben 2274 }
272 torben 2286
273     // nu skal vi ikke bruge idAddressMap længere
274     idAddressMap = null;
275    
276 torben 2279 //////////////////////////////////////////////////////////////////////////////////////
277 torben 2309 long start3 = System.currentTimeMillis();
278     System.out.println("Build, stage2 elapsed: " + (start3-start2) );
279 torben 2279 System.out.println("Build -- stage 3 - 100pct");
280 torben 2274
281 torben 2332 Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList();
282 torben 2279 for (Address addr : alleAdresser) {
283 torben 2286 if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {
284 torben 2279 continue;
285     }
286    
287     if (addr.distributor != null && addr.distributor.equals("LUKKET")) {
288     continue;
289     }
290    
291    
292     HundredePctBean bean = hundredePct.get(addr.postnr);
293     if (bean == null) {
294     continue;
295     }
296    
297     addr.daekningsType = DaekningsType.DAEKNING_100PCT;
298     addr.rute = bean.rute;
299     addr.koreliste = bean.koreliste;
300     addr.dbkBane = bean.dbkBane;
301     addr.distributor = bean.distributor;
302     }
303 torben 2276
304 torben 2286 ////////////////////////////////////////////////////////////////////////////////////
305 torben 2309 long stop = System.currentTimeMillis();
306     System.out.println("Build, stage3 elapsed: " + (stop-start3) );
307 torben 2286 System.out.println("Build -- Gathering statistics");
308 torben 2337
309 torben 2286 for (Address addr : alleAdresser) {
310     switch (addr.daekningsType) {
311     case DAEKNING_DIREKTE:
312 torben 2337 stats.direkteCount++;
313 torben 2286 break;
314     case DAEKNING_UDVIDET:
315 torben 2337 stats.extendedCount++;
316 torben 2286 break;
317     case DAEKNING_100PCT:
318 torben 2337 stats.hundredePctCount++;
319 torben 2286 break;
320     default:
321 torben 2337 stats.ikkeDaekketCount++;
322 torben 2286 }
323 torben 2339 }
324 torben 2286
325 torben 2338
326 torben 2339 stats.elapsed = stop-start1;
327     stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
328    
329 torben 2337 System.out.println("Build: direkteCount: " + stats.direkteCount);
330     System.out.println("Build: extendedCount: " + stats.extendedCount);
331     System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
332     System.out.println("Build: ikkeDaekketCount: " + stats.ikkeDaekketCount);
333 torben 2286
334 torben 2309 System.out.println("Build: Total Elapsed: " + (stop-start1) );
335 torben 2281 System.out.println("Build Completed");
336    
337 torben 2274 }
338    
339 torben 2337 public DataStatisticsBean getStatistics() {
340     return stats;
341     }
342 torben 2276
343 torben 2337 public void clear() {
344     searchPostnrVejnavnGadeid.clear();
345     searchGadeidentAdresser.clear();
346     alleAdresser.clear();
347     helperCache.clear();
348     }
349    
350    
351 torben 2388 private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) {
352     for(String vej : postnrVeje.keySet()) {
353     if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) {
354     System.out.println("Levenstein: " + vasketVejnavn + "->" + vej);
355     return vej;
356     }
357     }
358    
359     return null;
360     }
361    
362 torben 2283 private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {
363    
364     // ///////////////////////////////////////////////////////////////////
365     switch( eb.transport) {
366     case "cykel":
367     if (eb.afstand < 0.151) {
368     return "." + targetAddress.rute;
369     } else if (eb.afstand < 0.501) {
370     return ".." + targetAddress.rute;
371     } else if (eb.afstand < 0.701) {
372     return "..." + targetAddress.rute;
373     } else if (eb.afstand < 0.501) {
374     return "...." + targetAddress.rute;
375 torben 2276 }
376 torben 2283 break;
377     case "scooter":
378     if (eb.afstand < 0.151) {
379     return "." + targetAddress.rute;
380     } else if (eb.afstand < 0.801) {
381     return ".." + targetAddress.rute;
382     } else if (eb.afstand < 1.201) {
383     return "..." + targetAddress.rute;
384     } else if (eb.afstand < 2.101) {
385     return "...." + targetAddress.rute;
386     }
387     break;
388     case "bil":
389     if (eb.afstand < 0.151) {
390     return "." + targetAddress.rute;
391     } else if (eb.afstand < 1.001) {
392     return ".." + targetAddress.rute;
393     } else if (eb.afstand < 1.601) {
394     return "..." + targetAddress.rute;
395     } else if (eb.afstand < 2.601) {
396     return "...." + targetAddress.rute;
397     }
398 torben 2276 break;
399 torben 2283 }
400 torben 2276 return null;
401 torben 2332 }
402 torben 2276
403 torben 2332 public List<Address> getNonCoveredAddresses() {
404     List<Address> result = new ArrayList<Address>(60000);
405     for (Address a : alleAdresser) {
406     if ( a.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
407     result.add(a);
408     }
409     }
410 torben 2333 Collections.sort(result );
411 torben 2332 return result;
412     }
413    
414 torben 2283 ///////////////////////////////////////////////////////////
415     private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {
416     String inject;
417     if (eb.afstand <= 0.500) {
418     inject = ".";
419     } else {
420     inject = "..";
421     }
422     return AddressUtils.injectIntoBk(targetAddress.koreliste, inject);
423     }
424 torben 2276
425 torben 2292 private Set<String> findVejAliaser(String vejnavn) {
426 torben 2293 vejnavn = vejnavn.toLowerCase();
427 torben 2310 HashSet<String> aliasSet = new HashSet<String>();
428 torben 2292 aliasSet.add(vejnavn);
429    
430 torben 2312 aliasSet.add(vejnavn.replace("u", "ü") );
431     aliasSet.add(vejnavn.replace("ü", "u") );
432    
433 torben 2292 aliasSet.add(vejnavn.replace("alle", "allé") );
434 torben 2310 aliasSet.add(vejnavn.replace("allé", "alle") );
435 torben 2292
436 torben 2295 aliasSet.add(vejnavn.replace("dronningens", "dr") );
437     aliasSet.add(vejnavn.replace("dr.", "dronningens") );
438     aliasSet.add(vejnavn.replace("dr ", "dronningens") );
439    
440     aliasSet.add(vejnavn.replace("kvt", "kvarter") );
441     aliasSet.add(vejnavn.replace("kvarter", "kvt") );
442    
443 torben 2292 aliasSet.add(vejnavn.replace("gl", "gammel") );
444     aliasSet.add(vejnavn.replace("gammel", "gl") );
445    
446     aliasSet.add(vejnavn.replace("lille", "ll") );
447     aliasSet.add(vejnavn.replace("ll ", "lille") );
448     aliasSet.add(vejnavn.replace("ll.", "lille") );
449    
450     aliasSet.add(vejnavn.replace("store", "st") );
451     aliasSet.add(vejnavn.replace("st ", "store") );
452     aliasSet.add(vejnavn.replace("st.", "store") );
453    
454     aliasSet.add(vejnavn.replace("søndre", "sdr") );
455     aliasSet.add(vejnavn.replace("sdr", "søndre") );
456    
457    
458     aliasSet.add(vejnavn.replace("nørre", "nr") );
459     aliasSet.add(vejnavn.replace("nr", "nørre") );
460    
461     aliasSet.add(vejnavn.replace("nordre", "ndr") );
462     aliasSet.add(vejnavn.replace("ndr", "nordre") );
463    
464     aliasSet.add(vejnavn.replace("sankt", "skt") );
465 torben 2310 aliasSet.add(vejnavn.replace("sankt", "sct") );
466 torben 2292 aliasSet.add(vejnavn.replace("skt", "sankt") );
467    
468     aliasSet.add(vejnavn.replace("skt", "sct") );
469 torben 2362 aliasSet.add(vejnavn.replace("sct", "skt") );
470 torben 2292
471 torben 2379
472     //alternative måder at stave vej/gade/alle
473 torben 2362 aliasSet.add(vejnavn.replace("vej", "ve") );
474     aliasSet.add(vejnavn.replace("vej", "vj") );
475 torben 2386 aliasSet.add(vejnavn.replace("vej", "v") );
476 torben 2362
477     aliasSet.add(vejnavn.replace("alle", "all") );
478     aliasSet.add(vejnavn.replace("allé", "all") );
479 torben 2382 aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo
480     aliasSet.add(vejnavn.replace("allé", "allú") );
481 torben 2362
482 torben 2382 aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo
483 torben 2379
484    
485 torben 2310 // Opbyg æøå varianter over alle fundne aliaser
486    
487     @SuppressWarnings("unchecked")
488     HashSet<String> variants = (HashSet<String>) aliasSet.clone();
489    
490 torben 2313 for (String vVejnavn : variants) {
491 torben 2310 // danske tegn 1
492     aliasSet.add( vVejnavn.replace("æ", "ae") );
493     aliasSet.add( vVejnavn.replace("ø", "oe") );
494     aliasSet.add( vVejnavn.replace("å", "aa") );
495     aliasSet.add( vVejnavn.replace("ae", "æ") );
496     aliasSet.add( vVejnavn.replace("oe", "ø") );
497     aliasSet.add( vVejnavn.replace("aa", "å") );
498    
499     //danske tegn 2
500     aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") );
501     aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") );
502     aliasSet.add( vVejnavn.replace("ø", "ae").replace("å", "aa") );
503     aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") );
504     aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") );
505     aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") );
506    
507     //danske tegn 3
508     aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
509     aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
510     }
511    
512 torben 2292 return aliasSet;
513     }
514 torben 2283
515 torben 2292
516 torben 2267 }

  ViewVC Help
Powered by ViewVC 1.1.20