/[projects]/dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Diff of /dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2292 by torben, Sat Feb 14 09:31:46 2015 UTC revision 2389 by torben, Thu Feb 26 15:47:07 2015 UTC
# Line 1  Line 1 
1  package dk.daoas.daoadresseservice;  package dk.daoas.daoadresseservice;
2    
3  import java.sql.SQLException;  import java.sql.SQLException;
4    import java.text.SimpleDateFormat;
5    import java.util.ArrayList;
6    import java.util.Collections;
7    import java.util.Date;
8  import java.util.HashMap;  import java.util.HashMap;
9  import java.util.HashSet;  import java.util.HashSet;
10  import java.util.List;  import java.util.List;
# Line 8  import java.util.Map; Line 12  import java.util.Map;
12  import java.util.Set;  import java.util.Set;
13  import java.util.concurrent.ConcurrentHashMap;  import java.util.concurrent.ConcurrentHashMap;
14    
15  import dk.daoas.daoadresseservice.AddressUtils.SplitResult;  import org.apache.commons.lang3.StringUtils;
16    
17    import dk.daoas.daoadresseservice.admin.ServiceConfig;
18  import dk.daoas.daoadresseservice.beans.Address;  import dk.daoas.daoadresseservice.beans.Address;
19    import dk.daoas.daoadresseservice.beans.DataStatisticsBean;
20  import dk.daoas.daoadresseservice.beans.ExtendedBean;  import dk.daoas.daoadresseservice.beans.ExtendedBean;
21  import dk.daoas.daoadresseservice.beans.HundredePctBean;  import dk.daoas.daoadresseservice.beans.HundredePctBean;
22  import dk.daoas.daoadresseservice.beans.SearchResult;  import dk.daoas.daoadresseservice.beans.SearchResult;
# Line 18  import dk.daoas.daoadresseservice.db.Dat Line 25  import dk.daoas.daoadresseservice.db.Dat
25    
26  public class AdressSearch {  public class AdressSearch {
27    
28          Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;                private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;      
29          Map<Long,  Map<String,Address>> searchGadeidentAdresser;          private Map<Long,  Map<String,Address>> searchGadeidentAdresser;
30    
31          List<Address> alleAdresser;          private List<Address> alleAdresser;
32            
33            private Map<String,Long> helperCache;
34                    
35            private DataStatisticsBean stats = new DataStatisticsBean();
36                    
37          Map<Integer,HundredePctBean> hundredePct;          ServiceConfig config;
38            
39            public AdressSearch(ServiceConfig config) {
40                    this.config = config;
41            }
42                    
43                    
44          public SearchResult search(String postnrStr, String adresse)  {          public SearchResult search(String postnrStr, String adresse)  {
45  //long start1 = System.currentTimeMillis();                  
46                    SearchResult result = new SearchResult();
47                                    
48                  int postnr=0;                  int postnr=0;
49    
50                    String helperSearchKey = "";
51                                    
52                  try {                  try {
53                          postnr = Integer.parseInt(postnrStr);                          postnr = Integer.parseInt(postnrStr);
54                  } catch (Exception E) {                  } catch (Exception E) {
55                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
56                            return result;
57                  }                                }              
 //long start2 = System.currentTimeMillis();  
58                                    
59                  Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                                      Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                    
60                                    
61                  if (postnrVeje == null) {                  if (postnrVeje == null) {
62                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
63                            return result;
64                  }                  }
65                                    
 //long start3 = System.currentTimeMillis();  
66                                    
67                  SplitResult split = AddressUtils.splitAdresse(adresse);                  result.splitResult = AddressUtils.splitAdresse(adresse);
68                  String vasketVejnavn = AddressUtils.vaskVejnavn( split.vej );                                                                            
69                                    
70                  if (split.husnr.length() == 0) {                  if (result.splitResult.husnr.length() == 0) {
71                          return new SearchResult(Status.ERROR_MISSING_HOUSENUMBER);                                                result.status = Status.ERROR_MISSING_HOUSENUMBER;
72                            return result;
73                  }                  }
74  //long start4 = System.currentTimeMillis();                  
75                    String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej );
76                                    
77                  Long gadeident =  postnrVeje.get(vasketVejnavn);                  Long gadeident =  postnrVeje.get(vasketVejnavn);
78                    
79                    
80                    if ( gadeident == null) {
81                            helperSearchKey = "" + postnr + "/" + vasketVejnavn;
82                            gadeident = helperCache.get(helperSearchKey);
83                    }
84                    
85                  if (gadeident == null) {                  if (gadeident == null) {
86                          return new SearchResult(Status.ERROR_UNKNOWN_STREETNAME);                          String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje);
87                            if (best != null) {
88                                    result.levenshtein = true;
89                                    gadeident =  postnrVeje.get(best);
90                            }
91                  }                  }
 //long start5 = System.currentTimeMillis();  
92                                    
                 Map<String, Address> gade =  searchGadeidentAdresser.get(gadeident); //Denne søgning må ikke fejle  
93                                    
94  //long start6 = System.currentTimeMillis();                  // Brug OpenStreetMap før vi prøver google
95                    // For google har en request limit, det har OSM ikke!
96                    if ( gadeident == null) {
97                            if (config.useOpenStreetMaps) {
98                                    result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej );
99                                    result.osm = true;
100                                    
101                                    if (result.osmVej != null) {
102                                            String osmVasket = AddressUtils.vaskVejnavn( result.osmVej );
103                                            gadeident =  postnrVeje.get(osmVasket);
104                                            
105                                            if (gadeident != null) {
106                                                    helperCache.put(helperSearchKey, gadeident);
107                                            }
108                                    }
109                            }
110                    }
111                                    
112                  String husnrSearch = "" + split.husnr + split.litra;                  if ( gadeident == null) {
113                  Address addr = gade.get(husnrSearch);                          if (config.useGoogle) {
114  //long start7 = System.currentTimeMillis();                                  result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej );
115                  if (addr == null) {                                  result.google = true;
116                          return new SearchResult(Status.ERROR_UNKNOWN_ADDRESSPOINT);                                  
117                                    if (result.googleVej != null) {
118                                            String googleVasket = AddressUtils.vaskVejnavn( result.googleVej );
119                                            gadeident =  postnrVeje.get(googleVasket);
120                                            
121                                            if (gadeident != null) {
122                                                    helperCache.put(helperSearchKey, gadeident);
123                                            }
124                                    }
125                            }
126                  }                  }
127                                    
128                  if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {  
129                          return new SearchResult(Status.STATUS_NOT_COVERED);                  
130                    if (gadeident == null) {                        
131                            result.status = Status.ERROR_UNKNOWN_STREETNAME;
132                            return result;
133                  }                  }
134                                    
135                  if (addr.distributor.equals("LUKKET")) {                  Map<String, Address> gade = searchGadeidentAdresser.get(gadeident);
136                          return new SearchResult(Status.STATUS_NOT_COVERED); //Skal vi have en special status til Lukkede adresser ?                  if (gade == null) { //Denne søgning må ikke fejle
137                            result.status = Status.ERROR_INTERNAL;
138                            return result;                  
139                  }                  }
140                                    
141  /*                  
142  System.out.println("Search2: " + (start2-start1) );                  String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra;
143  System.out.println("Search3: " + (start3-start1) );                  Address addr = gade.get(husnrSearch);
 System.out.println("Search4: " + (start4-start1) );  
 System.out.println("Search5: " + (start5-start1) );  
 System.out.println("Search6: " + (start6-start1) );  
 System.out.println("Search7: " + (start7-start1) );  
 */  
144    
145                                                    if (addr == null) {
146                            result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT;
147                            return result;
148                    }
149                    
150                    result.address = addr;
151                    
152                    
153                    if ( StringUtils.equals(addr.distributor, "LUKKET") ) {                
154                            result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ?
155                            return result;
156                    }                              
157                                    
158                  return new SearchResult(addr);                  if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
159                            result.status = Status.STATUS_NOT_COVERED;
160                            return result;
161                    }
162    
163                    
164                    result.status = Status.STATUS_OK;
165    
166                    return result;
167          }          }
168                    
169                    
170          public void buildSearchStructures() throws SQLException{          public void buildSearchStructures() throws SQLException{
171                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();
172                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();
173                                                    helperCache = new ConcurrentHashMap<String,Long>();
174                    
175                    long start1 = System.currentTimeMillis();
176                  System.out.println("Build -- stage 1");                  System.out.println("Build -- stage 1");
177                                    
178                  alleAdresser = DatabaseLayer.getAllAdresses();                  alleAdresser = DatabaseLayer.getAllAdresses();
# Line 141  System.out.println("Search7: " + (start7 Line 215  System.out.println("Search7: " + (start7
215                                    
216                                    
217                  ////////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////////
218                    long start2 = System.currentTimeMillis();
219                    System.out.println("Build, stage1 elapsed: " + (start2-start1) );
220                  System.out.println("Build -- stage 2 udvidet dækning");                  System.out.println("Build -- stage 2 udvidet dækning");
221                                    
222                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();
# Line 198  System.out.println("Search7: " + (start7 Line 274  System.out.println("Search7: " + (start7
274                  idAddressMap = null;                  idAddressMap = null;
275                                    
276                  //////////////////////////////////////////////////////////////////////////////////////                  //////////////////////////////////////////////////////////////////////////////////////
277                    long start3 = System.currentTimeMillis();
278                    System.out.println("Build, stage2 elapsed: " + (start3-start2) );
279                  System.out.println("Build -- stage 3 - 100pct");                  System.out.println("Build -- stage 3 - 100pct");
280                                    
281                  hundredePct = DatabaseLayer.get100PctList();                  Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList();
282                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
283                          if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                                                  if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                        
284                                  continue;                                  continue;
# Line 224  System.out.println("Search7: " + (start7 Line 302  System.out.println("Search7: " + (start7
302                  }                  }
303                                    
304                  ////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////
305                    long stop = System.currentTimeMillis();
306                    System.out.println("Build, stage3 elapsed: " + (stop-start3) );
307                  System.out.println("Build -- Gathering statistics");                  System.out.println("Build -- Gathering statistics");
308                                                    
                 int direkteCount = 0;  
                 int extendedCount = 0;  
                 int hundredePctCount = 0;  
                 int ikkeDaekketCount = 0;  
                   
309                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
310                          switch (addr.daekningsType) {                          switch (addr.daekningsType) {
311                          case DAEKNING_DIREKTE:                          case DAEKNING_DIREKTE:
312                                  direkteCount++;                                  stats.direkteCount++;
313                                  break;                                  break;
314                          case DAEKNING_UDVIDET:                          case DAEKNING_UDVIDET:
315                                  extendedCount++;                                  stats.extendedCount++;
316                                  break;                                  break;
317                          case DAEKNING_100PCT:                          case DAEKNING_100PCT:
318                                  hundredePctCount++;                                  stats.hundredePctCount++;
319                                  break;                                  break;
320                          default:                          default:
321                                  ikkeDaekketCount++;                                  stats.ikkeDaekketCount++;
322                          }                          }
323                  }                  }              
324                                    
                 System.out.println("Build: direkteCount: " + direkteCount);  
                 System.out.println("Build: extendedCount: " + extendedCount);  
                 System.out.println("Build: hundredePctCount: " + hundredePctCount);  
                 System.out.println("Build: ikkeDaekketCount: " + ikkeDaekketCount);  
325                                    
326                    stats.elapsed = stop-start1;            
327                    stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
328                    
329                    System.out.println("Build: direkteCount: " + stats.direkteCount);
330                    System.out.println("Build: extendedCount: " + stats.extendedCount);
331                    System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
332                    System.out.println("Build: ikkeDaekketCount: " + stats.ikkeDaekketCount);
333                    
334                    System.out.println("Build: Total Elapsed: " + (stop-start1) );
335                  System.out.println("Build Completed");                  System.out.println("Build Completed");
336                                    
337          }          }
338                    
339            public DataStatisticsBean getStatistics() {
340                    return stats;
341            }
342            
343            public void clear() {
344                    searchPostnrVejnavnGadeid.clear();
345                    searchGadeidentAdresser.clear();
346                    alleAdresser.clear();
347                    helperCache.clear();
348            }
349            
350            
351            private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) {
352                    for(String vej : postnrVeje.keySet()) {
353                            if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) {
354                                    System.out.println("Levenstein: " + vasketVejnavn + "->" + vej);
355                                    return vej;
356                            }
357                    }
358                    
359                    return null;
360            }
361                    
362          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {
363    
# Line 296  System.out.println("Search7: " + (start7 Line 398  System.out.println("Search7: " + (start7
398                          break;                          break;
399                  }                                }              
400                  return null;                  return null;
401          }                }
402            
403            public List<Address> getNonCoveredAddresses() {
404                    List<Address> result = new ArrayList<Address>(60000);
405                    for (Address a : alleAdresser) {
406                            if ( a.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
407                                    result.add(a);
408                            }
409                    }
410                    Collections.sort(result );
411                    return result;
412            }
413                    
414          ///////////////////////////////////////////////////////////          ///////////////////////////////////////////////////////////
415          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {
# Line 310  System.out.println("Search7: " + (start7 Line 423  System.out.println("Search7: " + (start7
423          }          }
424                    
425          private Set<String> findVejAliaser(String vejnavn) {          private Set<String> findVejAliaser(String vejnavn) {
426                  Set<String> aliasSet = new HashSet<String>();                  vejnavn = vejnavn.toLowerCase();
427                    HashSet<String> aliasSet = new HashSet<String>();
428                  aliasSet.add(vejnavn);                  aliasSet.add(vejnavn);
429                                    
430                    aliasSet.add(vejnavn.replace("u", "ü") );
431                    aliasSet.add(vejnavn.replace("ü", "u") );
432                    
433                  aliasSet.add(vejnavn.replace("alle", "allé") );                  aliasSet.add(vejnavn.replace("alle", "allé") );
434                  aliasSet.add(vejnavn.replace("allé", "alle") );                  aliasSet.add(vejnavn.replace("allé", "alle") );                
435                                    
436                  // danske tegn 1                  aliasSet.add(vejnavn.replace("dronningens", "dr") );
437                  aliasSet.add(vejnavn.replace("æ", "ae") );                  aliasSet.add(vejnavn.replace("dr.", "dronningens") );
438                  aliasSet.add(vejnavn.replace("ø", "oe") );                  aliasSet.add(vejnavn.replace("dr ", "dronningens") );
                 aliasSet.add(vejnavn.replace("å", "aa") );  
                 aliasSet.add(vejnavn.replace("ae", "æ") );  
                 aliasSet.add(vejnavn.replace("oe", "ø") );  
                 aliasSet.add(vejnavn.replace("aa", "å") );  
                   
                 //danske tegn 2  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe") );  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ø", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe","ø") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("aa","å") );  
                 aliasSet.add( vejnavn.replace("oe", "ø").replace("aa", "å") );  
                   
                 //danske tegn 3  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );  
439                                    
440                    aliasSet.add(vejnavn.replace("kvt", "kvarter") );
441                    aliasSet.add(vejnavn.replace("kvarter", "kvt") );
442                                    
443                  aliasSet.add(vejnavn.replace("gl", "gammel") );                  aliasSet.add(vejnavn.replace("gl", "gammel") );
444                  aliasSet.add(vejnavn.replace("gammel", "gl") );                  aliasSet.add(vejnavn.replace("gammel", "gl") );
# Line 359  System.out.println("Search7: " + (start7 Line 462  System.out.println("Search7: " + (start7
462                  aliasSet.add(vejnavn.replace("ndr", "nordre") );                  aliasSet.add(vejnavn.replace("ndr", "nordre") );
463                                                                    
464                  aliasSet.add(vejnavn.replace("sankt", "skt") );                  aliasSet.add(vejnavn.replace("sankt", "skt") );
465                    aliasSet.add(vejnavn.replace("sankt", "sct") );
466                  aliasSet.add(vejnavn.replace("skt", "sankt") );                  aliasSet.add(vejnavn.replace("skt", "sankt") );
467                                    
468                  aliasSet.add(vejnavn.replace("skt", "sct") );                  aliasSet.add(vejnavn.replace("skt", "sct") );
469                  aliasSet.add(vejnavn.replace("sct", "skt") );                            aliasSet.add(vejnavn.replace("sct", "skt") );
470                                    
471                                    
472                    //alternative måder at stave vej/gade/alle
473                    aliasSet.add(vejnavn.replace("vej", "ve") );
474                    aliasSet.add(vejnavn.replace("vej", "vj") );
475                    aliasSet.add(vejnavn.replace("vej", "v") );
476                    
477                    aliasSet.add(vejnavn.replace("alle", "all") );
478                    aliasSet.add(vejnavn.replace("allé", "all") );
479                    aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo
480                    aliasSet.add(vejnavn.replace("allé", "allú") );
481                    
482                    aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo
483                    
484                    
485                    // Opbyg æøå varianter over alle fundne aliaser
486                    
487                    @SuppressWarnings("unchecked")
488                    HashSet<String> variants = (HashSet<String>) aliasSet.clone();
489                    
490                    for (String vVejnavn : variants) {                                      
491                            // danske tegn 1
492                            aliasSet.add( vVejnavn.replace("æ", "ae") );
493                            aliasSet.add( vVejnavn.replace("ø", "oe") );
494                            aliasSet.add( vVejnavn.replace("å", "aa") );
495                            aliasSet.add( vVejnavn.replace("ae", "æ") );
496                            aliasSet.add( vVejnavn.replace("oe", "ø") );
497                            aliasSet.add( vVejnavn.replace("aa", "å") );
498                            
499                            //danske tegn 2
500                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") );
501                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") );
502                            aliasSet.add( vVejnavn.replace("ø", "ae").replace("å", "aa") );
503                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") );
504                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") );
505                            aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") );
506                            
507                            //danske tegn 3
508                            aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
509                            aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
510                    }
511                                    
512                  return aliasSet;                  return aliasSet;
513          }          }

Legend:
Removed from v.2292  
changed lines
  Added in v.2389

  ViewVC Help
Powered by ViewVC 1.1.20