/[projects]/dao/DaoAdresseService/src/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Diff of /dao/DaoAdresseService/src/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2295 by torben, Sun Feb 15 09:57:55 2015 UTC revision 2391 by torben, Thu Feb 26 16:09:39 2015 UTC
# Line 1  Line 1 
1  package dk.daoas.daoadresseservice;  package dk.daoas.daoadresseservice;
2    
3  import java.sql.SQLException;  import java.sql.SQLException;
4    import java.text.SimpleDateFormat;
5    import java.util.ArrayList;
6    import java.util.Collections;
7    import java.util.Date;
8  import java.util.HashMap;  import java.util.HashMap;
9  import java.util.HashSet;  import java.util.HashSet;
10  import java.util.List;  import java.util.List;
# Line 8  import java.util.Map; Line 12  import java.util.Map;
12  import java.util.Set;  import java.util.Set;
13  import java.util.concurrent.ConcurrentHashMap;  import java.util.concurrent.ConcurrentHashMap;
14    
15  import dk.daoas.daoadresseservice.AddressUtils.SplitResult;  import org.apache.commons.lang3.StringUtils;
16    
17    import dk.daoas.daoadresseservice.admin.ServiceConfig;
18  import dk.daoas.daoadresseservice.beans.Address;  import dk.daoas.daoadresseservice.beans.Address;
19    import dk.daoas.daoadresseservice.beans.DataStatisticsBean;
20  import dk.daoas.daoadresseservice.beans.ExtendedBean;  import dk.daoas.daoadresseservice.beans.ExtendedBean;
21  import dk.daoas.daoadresseservice.beans.HundredePctBean;  import dk.daoas.daoadresseservice.beans.HundredePctBean;
22  import dk.daoas.daoadresseservice.beans.SearchResult;  import dk.daoas.daoadresseservice.beans.SearchResult;
# Line 18  import dk.daoas.daoadresseservice.db.Dat Line 25  import dk.daoas.daoadresseservice.db.Dat
25    
26  public class AdressSearch {  public class AdressSearch {
27    
28          Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;                private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid;      
29          Map<Long,  Map<String,Address>> searchGadeidentAdresser;          private Map<Long,  Map<String,Address>> searchGadeidentAdresser;
30    
31          List<Address> alleAdresser;          private List<Address> alleAdresser;
32            
33            private Map<String,Long> helperCache;
34                    
35            private DataStatisticsBean stats = new DataStatisticsBean();
36                    
37          Map<Integer,HundredePctBean> hundredePct;          ServiceConfig config;
38            
39            public AdressSearch(ServiceConfig config) {
40                    this.config = config;
41            }
42                    
43                    
44          public SearchResult search(String postnrStr, String adresse)  {          public SearchResult search(String postnrStr, String adresse)  {
45  //long start1 = System.currentTimeMillis();                  
46                    SearchResult result = new SearchResult();
47                                    
48                  int postnr=0;                  int postnr=0;
49    
50                    String helperSearchKey = "";
51                                    
52                  try {                  try {
53                          postnr = Integer.parseInt(postnrStr);                          postnr = Integer.parseInt(postnrStr);
54                  } catch (Exception E) {                  } catch (Exception E) {
55                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
56                            return result;
57                  }                                }              
 //long start2 = System.currentTimeMillis();  
58                                    
59                  Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                                      Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr);                    
60                                    
61                  if (postnrVeje == null) {                  if (postnrVeje == null) {
62                          return new SearchResult(Status.ERROR_UNKNOWN_POSTAL);                          result.status = Status.ERROR_UNKNOWN_POSTAL;
63                            return result;
64                  }                  }
65                                    
 //long start3 = System.currentTimeMillis();  
66                                    
67                  SplitResult split = AddressUtils.splitAdresse(adresse);                  result.splitResult = AddressUtils.splitAdresse(adresse);
68                  String vasketVejnavn = AddressUtils.vaskVejnavn( split.vej );                                                                            
69                                    
70                  if (split.husnr.length() == 0) {                  if (result.splitResult.husnr.length() == 0) {
71                          return new SearchResult(Status.ERROR_MISSING_HOUSENUMBER);                                                result.status = Status.ERROR_MISSING_HOUSENUMBER;
72                            return result;
73                  }                  }
74  //long start4 = System.currentTimeMillis();                  
75                    String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej );
76                                    
77                  Long gadeident =  postnrVeje.get(vasketVejnavn);                  Long gadeident =  postnrVeje.get(vasketVejnavn);
78                    
79                    
80                    if ( gadeident == null) {
81                            helperSearchKey = "" + postnr + "/" + vasketVejnavn;
82                            gadeident = helperCache.get(helperSearchKey);
83                    }
84                    
85                  if (gadeident == null) {                  if (gadeident == null) {
86                          return new SearchResult(Status.ERROR_UNKNOWN_STREETNAME);                          String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje);
87                            if (best != null) {
88                                    result.levenshtein = true;
89                                    gadeident =  postnrVeje.get(best);
90                            }
91                  }                  }
 //long start5 = System.currentTimeMillis();  
92                                    
                 Map<String, Address> gade =  searchGadeidentAdresser.get(gadeident); //Denne søgning må ikke fejle  
93                                    
94  //long start6 = System.currentTimeMillis();                  // Brug OpenStreetMap før vi prøver google
95                    // For google har en request limit, det har OSM ikke!
96                    if ( gadeident == null) {
97                            if (config.useOpenStreetMaps) {
98                                    result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej );
99                                    result.osm = true;
100                                    
101                                    if (result.osmVej != null) {
102                                            String osmVasket = AddressUtils.vaskVejnavn( result.osmVej );
103                                            gadeident =  postnrVeje.get(osmVasket);
104                                            
105                                            if (gadeident != null) {
106                                                    helperCache.put(helperSearchKey, gadeident);
107                                            }
108                                    }
109                            }
110                    }
111                                    
112                  String husnrSearch = "" + split.husnr + split.litra;                  if ( gadeident == null) {
113                  Address addr = gade.get(husnrSearch);                          if (config.useGoogle) {
114  //long start7 = System.currentTimeMillis();                                  result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej );
115                  if (addr == null) {                                  result.google = true;
116                          return new SearchResult(Status.ERROR_UNKNOWN_ADDRESSPOINT);                                  
117                                    if (result.googleVej != null) {
118                                            String googleVasket = AddressUtils.vaskVejnavn( result.googleVej );
119                                            gadeident =  postnrVeje.get(googleVasket);
120                                            
121                                            if (gadeident != null) {
122                                                    helperCache.put(helperSearchKey, gadeident);
123                                            }
124                                    }
125                            }
126                  }                  }
127                                    
128                  if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {  
129                          return new SearchResult(Status.STATUS_NOT_COVERED);                  
130                    if (gadeident == null) {                        
131                            result.status = Status.ERROR_UNKNOWN_STREETNAME;
132                            return result;
133                  }                  }
134                                    
135                  if (addr.distributor.equals("LUKKET")) {                  Map<String, Address> gade = searchGadeidentAdresser.get(gadeident);
136                          return new SearchResult(Status.STATUS_NOT_COVERED); //Skal vi have en special status til Lukkede adresser ?                  if (gade == null) { //Denne søgning må ikke fejle
137                            result.status = Status.ERROR_INTERNAL;
138                            return result;                  
139                  }                  }
140                                    
141  /*                  
142  System.out.println("Search2: " + (start2-start1) );                  String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra;
143  System.out.println("Search3: " + (start3-start1) );                  Address addr = gade.get(husnrSearch);
144  System.out.println("Search4: " + (start4-start1) );  
145  System.out.println("Search5: " + (start5-start1) );                  if (addr == null) {
146  System.out.println("Search6: " + (start6-start1) );                          result.status = Status.ERROR_UNKNOWN_ADDRESSPOINT;
147  System.out.println("Search7: " + (start7-start1) );                          return result;
148  */                  }
149                    
150                    result.address = addr;
151                    
152                    
153                    if ( StringUtils.equals(addr.distributor, "LUKKET") ) {                
154                            result.status = Status.STATUS_NOT_COVERED; //Skal vi have en special status til Lukkede adresser ?
155                            return result;
156                    }                              
157                    
158                    if (addr.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
159                            result.status = Status.STATUS_NOT_COVERED;
160                            return result;
161                    }
162    
                                   
163                                    
164                  return new SearchResult(addr);                  result.status = Status.STATUS_OK;
165    
166                    return result;
167          }          }
168                    
169                    
170          public void buildSearchStructures() throws SQLException{          public void buildSearchStructures() throws SQLException{
171                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();                  searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>();
172                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();                  searchGadeidentAdresser = new HashMap<Long,  Map<String,Address>>();
173                                                    helperCache = new ConcurrentHashMap<String,Long>();
174                    
175                    long start1 = System.currentTimeMillis();
176                  System.out.println("Build -- stage 1");                  System.out.println("Build -- stage 1");
177                                    
178                  alleAdresser = DatabaseLayer.getAllAdresses();                  alleAdresser = DatabaseLayer.getAllAdresses();
# Line 141  System.out.println("Search7: " + (start7 Line 215  System.out.println("Search7: " + (start7
215                                    
216                                    
217                  ////////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////////
218                    long start2 = System.currentTimeMillis();
219                    System.out.println("Build, stage1 elapsed: " + (start2-start1) );
220                  System.out.println("Build -- stage 2 udvidet dækning");                  System.out.println("Build -- stage 2 udvidet dækning");
221                                    
222                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();
# Line 198  System.out.println("Search7: " + (start7 Line 274  System.out.println("Search7: " + (start7
274                  idAddressMap = null;                  idAddressMap = null;
275                                    
276                  //////////////////////////////////////////////////////////////////////////////////////                  //////////////////////////////////////////////////////////////////////////////////////
277                    long start3 = System.currentTimeMillis();
278                    System.out.println("Build, stage2 elapsed: " + (start3-start2) );
279                  System.out.println("Build -- stage 3 - 100pct");                  System.out.println("Build -- stage 3 - 100pct");
280                                    
281                  hundredePct = DatabaseLayer.get100PctList();                  Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList();
282                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
283                          if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                                                  if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                        
284                                  continue;                                  continue;
# Line 224  System.out.println("Search7: " + (start7 Line 302  System.out.println("Search7: " + (start7
302                  }                  }
303                                    
304                  ////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////
305                    long stop = System.currentTimeMillis();
306                    System.out.println("Build, stage3 elapsed: " + (stop-start3) );
307                  System.out.println("Build -- Gathering statistics");                  System.out.println("Build -- Gathering statistics");
308                                                    
                 int direkteCount = 0;  
                 int extendedCount = 0;  
                 int hundredePctCount = 0;  
                 int ikkeDaekketCount = 0;  
                   
309                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
310                          switch (addr.daekningsType) {                          switch (addr.daekningsType) {
311                          case DAEKNING_DIREKTE:                          case DAEKNING_DIREKTE:
312                                  direkteCount++;                                  stats.direkteCount++;
313                                  break;                                  break;
314                          case DAEKNING_UDVIDET:                          case DAEKNING_UDVIDET:
315                                  extendedCount++;                                  stats.extendedCount++;
316                                  break;                                  break;
317                          case DAEKNING_100PCT:                          case DAEKNING_100PCT:
318                                  hundredePctCount++;                                  stats.hundredePctCount++;
319                                  break;                                  break;
320                          default:                          default:
321                                  ikkeDaekketCount++;                                  stats.ikkeDaekketCount++;
322                          }                          }
323                  }                  }              
324                                    
                 System.out.println("Build: direkteCount: " + direkteCount);  
                 System.out.println("Build: extendedCount: " + extendedCount);  
                 System.out.println("Build: hundredePctCount: " + hundredePctCount);  
                 System.out.println("Build: ikkeDaekketCount: " + ikkeDaekketCount);  
325                                    
326                    stats.elapsed = stop-start1;            
327                    stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
328                    
329                    System.out.println("Build: direkteCount: " + stats.direkteCount);
330                    System.out.println("Build: extendedCount: " + stats.extendedCount);
331                    System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
332                    System.out.println("Build: ikkeDaekketCount: " + stats.ikkeDaekketCount);
333                    
334                    System.out.println("Build: Total Elapsed: " + (stop-start1) );
335                  System.out.println("Build Completed");                  System.out.println("Build Completed");
336                                    
337          }          }
338                    
339            public DataStatisticsBean getStatistics() {
340                    return stats;
341            }
342            
343            public void clear() {
344                    searchPostnrVejnavnGadeid.clear();
345                    searchGadeidentAdresser.clear();
346                    alleAdresser.clear();
347                    helperCache.clear();
348            }
349            
350            
351            private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) {
352                    for(String vej : postnrVeje.keySet()) {
353                            if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) {
354                                    System.out.println("Levenstein: " + vasketVejnavn + "->" + vej);
355                                    return vej;
356                            }
357                    }
358                    
359                    return null;
360            }
361                    
362          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) {
363    
# Line 296  System.out.println("Search7: " + (start7 Line 398  System.out.println("Search7: " + (start7
398                          break;                          break;
399                  }                                }              
400                  return null;                  return null;
401          }                }
402            
403            public List<Address> getNonCoveredAddresses() {
404                    List<Address> result = new ArrayList<Address>(60000);
405                    for (Address a : alleAdresser) {
406                            if ( a.daekningsType == DaekningsType.DAEKNING_IKKEDAEKKET) {
407                                    result.add(a);
408                            }
409                    }
410                    Collections.sort(result );
411                    return result;
412            }
413                    
414          ///////////////////////////////////////////////////////////          ///////////////////////////////////////////////////////////
415          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {
# Line 311  System.out.println("Search7: " + (start7 Line 424  System.out.println("Search7: " + (start7
424                    
425          private Set<String> findVejAliaser(String vejnavn) {          private Set<String> findVejAliaser(String vejnavn) {
426                  vejnavn = vejnavn.toLowerCase();                  vejnavn = vejnavn.toLowerCase();
427                  Set<String> aliasSet = new HashSet<String>();                  HashSet<String> aliasSet = new HashSet<String>();
428                  aliasSet.add(vejnavn);                  aliasSet.add(vejnavn);
429                                    
430                  aliasSet.add(vejnavn.replace("alle", "allé") );                  aliasSet.add(vejnavn.replace("u", "ü") );
431                  aliasSet.add(vejnavn.replace("allé", "alle") );                  aliasSet.add(vejnavn.replace("ü", "u") );
                   
                 // danske tegn 1  
                 aliasSet.add(vejnavn.replace("æ", "ae") );  
                 aliasSet.add(vejnavn.replace("ø", "oe") );  
                 aliasSet.add(vejnavn.replace("å", "aa") );  
                 aliasSet.add(vejnavn.replace("ae", "æ") );  
                 aliasSet.add(vejnavn.replace("oe", "ø") );  
                 aliasSet.add(vejnavn.replace("aa", "å") );  
                   
                 //danske tegn 2  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe") );  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ø", "ae").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe","ø") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("aa","å") );  
                 aliasSet.add( vejnavn.replace("oe", "ø").replace("aa", "å") );  
                   
                 //danske tegn 3  
                 aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );  
                 aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );  
432                                    
433                    aliasSet.add(vejnavn.replace("alle", "allé") );
434                    aliasSet.add(vejnavn.replace("allé", "alle") );                
435                                    
436                  aliasSet.add(vejnavn.replace("dronningens", "dr") );                  aliasSet.add(vejnavn.replace("dronningens", "dr") );
437                  aliasSet.add(vejnavn.replace("dr.", "dronningens") );                  aliasSet.add(vejnavn.replace("dr.", "dronningens") );
438                  aliasSet.add(vejnavn.replace("dr ", "dronningens") );                  aliasSet.add(vejnavn.replace("dr ", "dronningens") );
439                                    
440                    aliasSet.add(vejnavn.replace("dronning", "dr") );
441                    aliasSet.add(vejnavn.replace("dr.", "dronning") );
442                    aliasSet.add(vejnavn.replace("dr ", "dronning") );
443                    
444                    aliasSet.add(vejnavn.replace("kng", "kongen") );
445                    aliasSet.add(vejnavn.replace("kongen", "kng") );
446                    
447                  aliasSet.add(vejnavn.replace("kvt", "kvarter") );                  aliasSet.add(vejnavn.replace("kvt", "kvarter") );
448                  aliasSet.add(vejnavn.replace("kvarter", "kvt") );                  aliasSet.add(vejnavn.replace("kvarter", "kvt") );
449                                    
# Line 367  System.out.println("Search7: " + (start7 Line 469  System.out.println("Search7: " + (start7
469                  aliasSet.add(vejnavn.replace("ndr", "nordre") );                  aliasSet.add(vejnavn.replace("ndr", "nordre") );
470                                                                    
471                  aliasSet.add(vejnavn.replace("sankt", "skt") );                  aliasSet.add(vejnavn.replace("sankt", "skt") );
472                    aliasSet.add(vejnavn.replace("sankt", "sct") );
473                  aliasSet.add(vejnavn.replace("skt", "sankt") );                  aliasSet.add(vejnavn.replace("skt", "sankt") );
474                                    
475                  aliasSet.add(vejnavn.replace("skt", "sct") );                  aliasSet.add(vejnavn.replace("skt", "sct") );
476                  aliasSet.add(vejnavn.replace("sct", "skt") );                                            aliasSet.add(vejnavn.replace("sct", "skt") );
477                    
478                    
479                    //alternative måder at stave vej/gade/alle
480                    aliasSet.add(vejnavn.replace("vej", "ve") );
481                    aliasSet.add(vejnavn.replace("vej", "vj") );
482                    aliasSet.add(vejnavn.replace("vej", "v") );
483                    
484                    aliasSet.add(vejnavn.replace("alle", "all") );
485                    aliasSet.add(vejnavn.replace("allé", "all") );
486                    aliasSet.add(vejnavn.replace("alle", "allú") ); //Fundet i logs.hentruteinfo
487                    aliasSet.add(vejnavn.replace("allé", "allú") );
488                    
489                    aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo
490                    
491                    
492                    // Opbyg æøå varianter over alle fundne aliaser
493                    
494                    @SuppressWarnings("unchecked")
495                    HashSet<String> variants = (HashSet<String>) aliasSet.clone();
496                    
497                    for (String vVejnavn : variants) {                                      
498                            // danske tegn 1
499                            aliasSet.add( vVejnavn.replace("æ", "ae") );
500                            aliasSet.add( vVejnavn.replace("ø", "oe") );
501                            aliasSet.add( vVejnavn.replace("å", "aa") );
502                            aliasSet.add( vVejnavn.replace("ae", "æ") );
503                            aliasSet.add( vVejnavn.replace("oe", "ø") );
504                            aliasSet.add( vVejnavn.replace("aa", "å") );
505                            
506                            //danske tegn 2
507                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") );
508                            aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") );
509                            aliasSet.add( vVejnavn.replace("ø", "ae").replace("å", "aa") );
510                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") );
511                            aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") );
512                            aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") );
513                            
514                            //danske tegn 3
515                            aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
516                            aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
517                    }
518                                    
519                  return aliasSet;                  return aliasSet;
520          }          }

Legend:
Removed from v.2295  
changed lines
  Added in v.2391

  ViewVC Help
Powered by ViewVC 1.1.20