/[projects]/dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Diff of /dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2295 by torben, Sun Feb 15 09:57:55 2015 UTC revision 2388 by torben, Thu Feb 26 15:02:19 2015 UTC
# Line 1  Line 1 
1  package dk.daoas.daoadresseservice;  package dk.daoas.daoadresseservice;
2    
3  import java.sql.SQLException;  import java.sql.SQLException;
4    import java.text.SimpleDateFormat;
5    import java.util.ArrayList;
6    import java.util.Collections;
7    import java.util.Date;
8  import java.util.HashMap;  import java.util.HashMap;
9  import java.util.HashSet;  import java.util.HashSet;
10  import java.util.List;  import java.util.List;
# Line 8  import java.util.Map; Line 12  import java.util.Map;
12  import java.util.Set;  import java.util.Set;
13  import java.util.concurrent.ConcurrentHashMap;  import java.util.concurrent.ConcurrentHashMap;
14    
15  import dk.daoas.daoadresseservice.AddressUtils.SplitResult;  import org.apache.commons.lang3.StringUtils;
16    
17    import dk.daoas.daoadresseservice.admin.ServiceConfig;
18  import dk.daoas.daoadresseservice.beans.Address;  import dk.daoas.daoadresseservice.beans.Address;
19    import dk.daoas.daoadresseservice.beans.DataStatisticsBean;
20  import dk.daoas.daoadresseservice.beans.ExtendedBean;  import dk.daoas.daoadresseservice.beans.ExtendedBean;
21  import dk.daoas.daoadresseservice.beans.HundredePctBean;  import dk.daoas.daoadresseservice.beans.HundredePctBean;
22  import dk.daoas.daoadresseservice.beans.SearchResult;  import dk.daoas.daoadresseservice.beans.SearchResult;
# Line 18  import dk.daoas.daoadresseservice.db.Dat Line 25  import dk.daoas.daoadresseservice.db.Dat
25    
26  public class AdressSearch {  public class AdressSearch {
27    
28          Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;                private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;      
29          Map<Long,  Map<String,Address>> searchGadeidentAdresser;          private Map<Long,  Map<String,Address>> searchGadeidentAdresser;
30    
31          List<Address> alleAdresser;          private List<Address> alleAdresser;
32            
33            private Map<String,Long> helperCache;
34                    
35            private DataStatisticsBean stats = new DataStatisticsBean();
36                    
37          Map<Integer,HundredePctBean> hundredePct;          ServiceConfig config;
38            
39            public AdressSearch(ServiceConfig config) {
40                    this.config = config;
41            }
42                    
43                    
44          public SearchResult search(String postnrStr, String adresse)  {          public SearchResult search(String postnrStr, String adresse)  {
45  //long start1 = System.currentTimeMillis();                  
46                    SearchResult result = new SearchResult();
47                                    
48                  int postnr=0;                  int postnr=0;
49    
50                    String helperSearchKey = "";
51                                    
52                  try {                  try {
53                          postnr = Integer.parseInt(postnrStr);                          postnr = Integer.parseInt(postnrStr);
54                  } catch (Exception E) {                  } catch (Exception E) {
55                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
56                            return result;
57                  }                                }              
 //long start2 = System.currentTimeMillis();  
58                                    
59                  Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                                      Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                    
60                                    
61                  if (postnrVeje == null) {                  if (postnrVeje == null) {
62                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
63                            return result;
64                  }                  }
65                                    
 //long start3 = System.currentTimeMillis();  
66                                    
67                  SplitResult split = AddressUtils.splitAdresse(adresse);                  result.splitResult = AddressUtils.splitAdresse(adresse);
68                  String vasketVejnavn = AddressUtils.vaskVejnavn( split.vej );                                                                            
69                                    
70                  if (split.husnr.length() == 0) {                  if (result.splitResult.husnr.length() == 0) {
71                          return new SearchResult(Status.ERROR_MISSING_HOUSENUMBER);                                                result.status = Status.ERROR_MISSING_HOUSENUMBER;
72                            return result;
73                  }                  }
74  //long start4 = System.currentTimeMillis();                  
75                    String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej );
76                                    
77                  Long gadeident =  postnrVeje.get(vasketVejnavn);                  Long gadeident =  postnrVeje.get(vasketVejnavn);
78                    
79                    
80                    if ( gadeident == null) {
81                            helperSearchKey = "" + postnr + "/" + vasketVejnavn;
82                            gadeident = helperCache.get(helperSearchKey);
83                    }
84                    
85                  if (gadeident == null) {                  if (gadeident == null) {
86                          return new SearchResult(Status.ERROR_UNKNOWN_STREETNAME);                          String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje);
87                            if (best != null) {
88                                    gadeident =  postnrVeje.get(best);
89                            }
90                  }                  }
 //long start5 = System.currentTimeMillis();  
91                                    
                 Map<String, Address> gade =  searchGadeidentAdresser.get(gadeident); //Denne søgning må ikke fejle  
92                                    
93  //long start6 = System.currentTimeMillis();                  // Brug OpenStreetMap før vi prøver google
94                    // For google har en request limit, det har OSM ikke!
95                    if ( gadeident == null) {
96                            if (config.useOpenStreetMaps) {
97                                    result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej );
98                                    result.osm = true;
99                                    
100                                    if (result.osmVej != null) {
101                                            String osmVasket = AddressUtils.vaskVejnavn( result.osmVej );
102                                            gadeident =  postnrVeje.get(osmVasket);
103                                            
104                                            if (gadeident != null) {
105                                                    helperCache.put(helperSearchKey, gadeident);
106                                            }
107                                    }
108                            }
109                    }
110                                    
111                  String husnrSearch = "" + split.husnr + split.litra;                  if ( gadeident == null) {
112                  Address addr = gade.get(husnrSearch);                          if (config.useGoogle) {
113  //long start7 = System.currentTimeMillis();                                  result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej );
114                  if (addr == null) {                                  result.google = true;
115                          return new SearchResult(Status.ERROR_UNKNOWN_ADDRESSPOINT);                                  
116                                    if (result.googleVej != null) {
117                                            String googleVasket = AddressUtils.vaskVejnavn( result.googleVej );
118                                            gadeident =  postnrVeje.get(googleVasket);
119                                            
120                                            if (gadeident != null) {
121                                                    helperCache.put(helperSearchKey, gadeident);
122                                            }
123                                    }
124                            }
125                  }                  }
126                                    
127                  if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {  
128                          return new SearchResult(Status.STATUS_NOT_COVERED);                  
129                    if (gadeident == null) {                        
130                            result.status = Status.ERROR_UNKNOWN_STREETNAME;
131                            return result;
132                  }                  }
133                                    
134                  if (addr.distributor.equals("LUKKET")) {                  Map<String, Address> gade = searchGadeidentAdresser.get(gadeident);
135                          return new SearchResult(Status.STATUS_NOT_COVERED); //Skal vi have en special status til Lukkede adresser ?                  if (gade == null) { //Denne søgning må ikke fejle
136                            result.status = Status.ERROR_INTERNAL;
137                            return result;                  
138                  }                  }
139                                    
140  /*                  
141  System.out.println("Search2: " + (start2-start1) );                  String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra;
142  System.out.println("Search3: " + (start3-start1) );                  Address addr = gade.get(husnrSearch);
143  System.out.println("Search4: " + (start4-start1) );  
144  System.out.println("Search5: " + (start5-start1) );                  if (addr == null) {
145  System.out.println("Search6: " + (start6-start1) );                          result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT;
146  System.out.println("Search7: " + (start7-start1) );                          return result;
147  */                  }
148                    
149                    result.address = addr;
150                    
151                    
152                    if ( StringUtils.equals(addr.distributor, "LUKKET") ) {                
153                            result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ?
154                            return result;
155                    }                              
156                    
157                    if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
158                            result.status = Status.STATUS_NOT_COVERED;
159                            return result;
160                    }
161    
                                   
162                                    
163                  return new SearchResult(addr);                  result.status = Status.STATUS_OK;
164    
165                    return result;
166          }          }
167                    
168                    
169          public void buildSearchStructures() throws SQLException{          public void buildSearchStructures() throws SQLException{
170                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();
171                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();
172                                                    helperCache = new ConcurrentHashMap<String,Long>();
173                    
174                    long start1 = System.currentTimeMillis();
175                  System.out.println("Build -- stage 1");                  System.out.println("Build -- stage 1");
176                                    
177                  alleAdresser = DatabaseLayer.getAllAdresses();                  alleAdresser = DatabaseLayer.getAllAdresses();
# Line 141  System.out.println("Search7: " + (start7 Line 214  System.out.println("Search7: " + (start7
214                                    
215                                    
216                  ////////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////////
217                    long start2 = System.currentTimeMillis();
218                    System.out.println("Build, stage1 elapsed: " + (start2-start1) );
219                  System.out.println("Build -- stage 2 udvidet dækning");                  System.out.println("Build -- stage 2 udvidet dækning");
220                                    
221                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();
# Line 198  System.out.println("Search7: " + (start7 Line 273  System.out.println("Search7: " + (start7
273                  idAddressMap = null;                  idAddressMap = null;
274                                    
275                  //////////////////////////////////////////////////////////////////////////////////////                  //////////////////////////////////////////////////////////////////////////////////////
276                    long start3 = System.currentTimeMillis();
277                    System.out.println("Build, stage2 elapsed: " + (start3-start2) );
278                  System.out.println("Build -- stage 3 - 100pct");                  System.out.println("Build -- stage 3 - 100pct");
279                                    
280                  hundredePct = DatabaseLayer.get100PctList();                  Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList();
281                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
282                          if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                                                  if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                        
283                                  continue;                                  continue;
# Line 224  System.out.println("Search7: " + (start7 Line 301  System.out.println("Search7: " + (start7
301                  }                  }
302                                    
303                  ////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////
304                    long stop = System.currentTimeMillis();
305                    System.out.println("Build, stage3 elapsed: " + (stop-start3) );
306                  System.out.println("Build -- Gathering statistics");                  System.out.println("Build -- Gathering statistics");
307                                                    
                 int direkteCount = 0;  
                 int extendedCount = 0;  
                 int hundredePctCount = 0;  
                 int ikkeDaekketCount = 0;  
                   
308                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
309                          switch (addr.daekningsType) {                          switch (addr.daekningsType) {
310                          case DAEKNING_DIREKTE:                          case DAEKNING_DIREKTE:
311                                  direkteCount++;                                  stats.direkteCount++;
312                                  break;                                  break;
313                          case DAEKNING_UDVIDET:                          case DAEKNING_UDVIDET:
314                                  extendedCount++;                                  stats.extendedCount++;
315                                  break;                                  break;
316                          case DAEKNING_100PCT:                          case DAEKNING_100PCT:
317                                  hundredePctCount++;                                  stats.hundredePctCount++;
318                                  break;                                  break;
319                          default:                          default:
320                                  ikkeDaekketCount++;                                  stats.ikkeDaekketCount++;
321                          }                          }
322                  }                  }              
323                    
324                                    
325                  System.out.println("Build: direkteCount: " + direkteCount);                  stats.elapsed = stop-start1;            
326                  System.out.println("Build: extendedCount: " + extendedCount);                  stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
                 System.out.println("Build: hundredePctCount: " + hundredePctCount);  
                 System.out.println("Build: ikkeDaekketCount: " + ikkeDaekketCount);  
327                                    
328                    System.out.println("Build: direkteCount: " + stats.direkteCount);
329                    System.out.println("Build: extendedCount: " + stats.extendedCount);
330                    System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
331                    System.out.println("Build: ikkeDaekketCount: " + stats.ikkeDaekketCount);
332                    
333                    System.out.println("Build: Total Elapsed: " + (stop-start1) );
334                  System.out.println("Build Completed");                  System.out.println("Build Completed");
335                                    
336          }          }
337                    
338            public DataStatisticsBean getStatistics() {
339                    return stats;
340            }
341            
342            public void clear() {
343                    searchPostnrVejnavnGadeid.clear();
344                    searchGadeidentAdresser.clear();
345                    alleAdresser.clear();
346                    helperCache.clear();
347            }
348            
349            
350            private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) {
351                    for(String vej : postnrVeje.keySet()) {
352                            if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) {
353                                    System.out.println("Levenstein: " + vasketVejnavn + "->" + vej);
354                                    return vej;
355                            }
356                    }
357                    
358                    return null;
359            }
360                    
361          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {
362    
# Line 296  System.out.println("Search7: " + (start7 Line 397  System.out.println("Search7: " + (start7
397                          break;                          break;
398                  }                                }              
399                  return null;                  return null;
400          }                }
401            
402            public List<Address> getNonCoveredAddresses() {
403                    List<Address> result = new ArrayList<Address>(60000);
404                    for (Address a : alleAdresser) {
405                            if ( a.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
406                                    result.add(a);
407                            }
408                    }
409                    Collections.sort(result );
410                    return result;
411            }
412                    
413          ///////////////////////////////////////////////////////////          ///////////////////////////////////////////////////////////
414          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {
# Line 311  System.out.println("Search7: " + (start7 Line 423  System.out.println("Search7: " + (start7
423                    
424          private Set<String> findVejAliaser(String vejnavn) {          private Set<String> findVejAliaser(String vejnavn) {
425                  vejnavn = vejnavn.toLowerCase();                  vejnavn = vejnavn.toLowerCase();
426                  Set<String> aliasSet = new HashSet<String>();                  HashSet<String> aliasSet = new HashSet<String>();
427                  aliasSet.add(vejnavn);                  aliasSet.add(vejnavn);
428                                    
429                  aliasSet.add(vejnavn.replace("alle", "allé") );                  aliasSet.add(vejnavn.replace("u", "ü") );
430                  aliasSet.add(vejnavn.replace("allé", "alle") );                  aliasSet.add(vejnavn.replace("ü", "u") );
                   
                 // danske tegn 1  
                 aliasSet.add(vejnavn.replace("æ", "ae") );  
                 aliasSet.add(vejnavn.replace("ø", "oe") );  
                 aliasSet.add(vejnavn.replace("å", "aa") );  
                 aliasSet.add(vejnavn.replace("ae", "æ") );  
                 aliasSet.add(vejnavn.replace("oe", "ø") );  
                 aliasSet.add(vejnavn.replace("aa", "å") );  
                   
                 //danske tegn 2  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe") );  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ø", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe","ø") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("aa","å") );  
                 aliasSet.add( vejnavn.replace("oe", "ø").replace("aa", "å") );  
                   
                 //danske tegn 3  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );  
431                                    
432                    aliasSet.add(vejnavn.replace("alle", "allé") );
433                    aliasSet.add(vejnavn.replace("allé", "alle") );                
434                                    
435                  aliasSet.add(vejnavn.replace("dronningens", "dr") );                  aliasSet.add(vejnavn.replace("dronningens", "dr") );
436                  aliasSet.add(vejnavn.replace("dr.", "dronningens") );                  aliasSet.add(vejnavn.replace("dr.", "dronningens") );
# Line 367  System.out.println("Search7: " + (start7 Line 461  System.out.println("Search7: " + (start7
461                  aliasSet.add(vejnavn.replace("ndr", "nordre") );                  aliasSet.add(vejnavn.replace("ndr", "nordre") );
462                                                                    
463                  aliasSet.add(vejnavn.replace("sankt", "skt") );                  aliasSet.add(vejnavn.replace("sankt", "skt") );
464                    aliasSet.add(vejnavn.replace("sankt", "sct") );
465                  aliasSet.add(vejnavn.replace("skt", "sankt") );                  aliasSet.add(vejnavn.replace("skt", "sankt") );
466                                    
467                  aliasSet.add(vejnavn.replace("skt", "sct") );                  aliasSet.add(vejnavn.replace("skt", "sct") );
468                  aliasSet.add(vejnavn.replace("sct", "skt") );                                            aliasSet.add(vejnavn.replace("sct", "skt") );
469                    
470                    
471                    //alternative måder at stave vej/gade/alle
472                    aliasSet.add(vejnavn.replace("vej", "ve") );
473                    aliasSet.add(vejnavn.replace("vej", "vj") );
474                    aliasSet.add(vejnavn.replace("vej", "v") );
475                    
476                    aliasSet.add(vejnavn.replace("alle", "all") );
477                    aliasSet.add(vejnavn.replace("allé", "all") );
478                    aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo
479                    aliasSet.add(vejnavn.replace("allé", "allú") );
480                    
481                    aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo
482                    
483                    
484                    // Opbyg æøå varianter over alle fundne aliaser
485                    
486                    @SuppressWarnings("unchecked")
487                    HashSet<String> variants = (HashSet<String>) aliasSet.clone();
488                    
489                    for (String vVejnavn : variants) {                                      
490                            // danske tegn 1
491                            aliasSet.add( vVejnavn.replace("æ", "ae") );
492                            aliasSet.add( vVejnavn.replace("ø", "oe") );
493                            aliasSet.add( vVejnavn.replace("å", "aa") );
494                            aliasSet.add( vVejnavn.replace("ae", "æ") );
495                            aliasSet.add( vVejnavn.replace("oe", "ø") );
496                            aliasSet.add( vVejnavn.replace("aa", "å") );
497                            
498                            //danske tegn 2
499                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") );
500                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") );
501                            aliasSet.add( vVejnavn.replace("ø", "ae").replace("å", "aa") );
502                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") );
503                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") );
504                            aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") );
505                            
506                            //danske tegn 3
507                            aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
508                            aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
509                    }
510                                    
511                  return aliasSet;                  return aliasSet;
512          }          }

Legend:
Removed from v.2295  
changed lines
  Added in v.2388

  ViewVC Help
Powered by ViewVC 1.1.20