/[projects]/dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Diff of /dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2552 by torben, Fri May 22 06:38:54 2015 UTC revision 2778 by torben, Fri Nov 20 16:31:01 2015 UTC
# Line 27  import dk.daoas.daoadresseservice.beans. Line 27  import dk.daoas.daoadresseservice.beans.
27  import dk.daoas.daoadresseservice.beans.SearchResult;  import dk.daoas.daoadresseservice.beans.SearchResult;
28  import dk.daoas.daoadresseservice.beans.SearchResult.Status;  import dk.daoas.daoadresseservice.beans.SearchResult.Status;
29  import dk.daoas.daoadresseservice.db.DatabaseLayer;  import dk.daoas.daoadresseservice.db.DatabaseLayer;
30    import dk.daoas.daoadresseservice.util.DaoUtils;
31  import dk.daoas.daoadresseservice.util.DeduplicateHelper;  import dk.daoas.daoadresseservice.util.DeduplicateHelper;
32  import dk.daoas.daoadresseservice.util.NaturalOrderComparator;  import dk.daoas.daoadresseservice.util.NaturalOrderComparator;
33    
# Line 41  public class AddressSearch { Line 42  public class AddressSearch {
42                    
43          private DataStatisticsBean stats = new DataStatisticsBean();          private DataStatisticsBean stats = new DataStatisticsBean();
44                    
45          ServiceConfig config;          private DatabaseLayer db;
46            
47                    
48          StreetnameHelper levenshteinHelper;          StreetnameHelper levenshteinHelper;
49            StreetnameHelper metaphoneHelper;
50          StreetnameHelper googleHelper;          StreetnameHelper googleHelper;
51          StreetnameHelper osmHelper;          StreetnameHelper osmHelper;
52                    
53                    
54          public AddressSearch(ServiceConfig config) {          public AddressSearch(DatabaseLayer db, ServiceConfig config) {
55                  this.config = config;                  
56                    this.db = db;
57                                    
58                  levenshteinHelper = new LevenshteinStreetnameHelper( this );                  levenshteinHelper = new LevenshteinStreetnameHelper( this );
59                    metaphoneHelper = new DoubleMetaphoneStreetnameHelper(config);
60                  googleHelper = new GoogleStreetnameHelper( config );                  googleHelper = new GoogleStreetnameHelper( config );
61                  osmHelper = new OSMStreetnameHelper( config );                  osmHelper = new OSMStreetnameHelper( config );
62          }          }
63                    
64            public Address getAddressSafe(int gadeid, String husnr)  throws Exception {
65                    
66                    Map<String,Address> gade = searchGadeidentAdresser.get(gadeid);
67                    
68                    if (gade == null) {
69                            throw new Exception("GadeID ikke fundet");
70                    }
71                    
72                    Address addr = gade.get(husnr);
73                    
74                    if (addr == null) {
75                            throw new Exception("Adresse ikke ikke fundet");
76                    }
77                                    
78                    return addr;
79            }
80            
81                    
82          public SearchResult search(String postnrStr, String adresse)  {          public SearchResult search(String postnrStr, String adresse)  {
83                                    
# Line 66  public class AddressSearch { Line 88  public class AddressSearch {
88                  SearchRequest request = new SearchRequest();                  SearchRequest request = new SearchRequest();
89                  SearchResult result = new SearchResult();                  SearchResult result = new SearchResult();
90                                    
   
                 String helperSearchKey = "";  
91                                    
92                  try {                  try {
93                          request.postnr = Short.parseShort(postnrStr);                          request.postnr = Short.parseShort(postnrStr);
# Line 109  public class AddressSearch { Line 129  public class AddressSearch {
129                          return result;                                            return result;                  
130                  }                  }
131                                    
132                  Integer gadeident =  request.streetNames.get(result.vasketVejnavn);                  // LookupStreetname er en indkapsling af alm + levenstein + google + osm
133                    Integer gadeident = lookupStretname(request, result, true);
134                                    
135                                    
136                  if ( gadeident == null) {                  /*
137                          helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn;                   * Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn
138                          gadeident = helperCache.get(helperSearchKey);                   *
139                  }                   * <strike>Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt</strike>*/
                   
140                  if (gadeident == null) {                  if (gadeident == null) {
141                          String vej = levenshteinHelper.proposeStreetName(request, result);                          final int MAX_TRIES = 4;
142                          if (vej != null) {                          
143                                  gadeident =  request.streetNames.get(vej);                          String vejnavnParts[] = request.vejnavn.split(" ");
144                          }                          
145                  }                          for (int i=1; i<=MAX_TRIES && i<vejnavnParts.length; i++) {
146                                                    String subVejnavn = DaoUtils.joinHelper(vejnavnParts, i);
147                                                    
148                  // Brug OpenStreetMap før vi prøver google                                  request.vejnavn = subVejnavn;
149                  // For google har en request limit, det har OSM ikke!                                  result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );
150                  if ( gadeident == null) {                                  
151                          String vej = osmHelper.proposeStreetName(request, result);                                                gadeident = lookupStretname(request, result, false);//prøv opslag MEN UDEN GOOGLE/OSM !!!
152                          gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);                                  
153                  }                                  //hvis vi fandt vejen ud fra substrengen
154                                                    if (gadeident != null) {
155                  if ( gadeident == null) {                                          break;
156                          String vej = googleHelper.proposeStreetName(request, result);                                            }                      
157                          gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);                                  
158                                    //hvis vi ikke fandt kopierer vi vejnavn fra split igen
159                                    request.vejnavn = result.splitResult.vej;
160                                    result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );
161                            }                      
162                  }                  }
163                                    
164    
# Line 184  public class AddressSearch { Line 208  public class AddressSearch {
208    
209                  return result;                  return result;
210          }          }
211    
212    
213            private Integer lookupStretname(SearchRequest request, SearchResult result, boolean useExternal) {
214                    String helperSearchKey = "";
215                    
216                    Integer gadeident =  request.streetNames.get(result.vasketVejnavn);
217                    
218                    
219                    if ( gadeident == null) {
220                            helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn;
221                            gadeident = helperCache.get(helperSearchKey);
222                    }
223                    
224                    if (gadeident == null) {
225                            String vej = levenshteinHelper.proposeStreetName(request, result);
226                            if (vej != null) {
227                                    gadeident =  request.streetNames.get(vej);
228                            }
229                    }
230                    
231                    if (gadeident == null) {
232                            String vej = levenshteinHelper.proposeStreetName(request, result);
233                            if (vej != null) {
234                                    gadeident =  request.streetNames.get(vej);
235                            }
236                    }
237                    
238                    
239                    // Brug OpenStreetMap før vi prøver google
240                    // For google har en request limit, det har OSM ikke!
241                    if ( gadeident == null && useExternal) {
242                            String vej = osmHelper.proposeStreetName(request, result);              
243                            gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
244                    }
245                    
246                    if ( gadeident == null && useExternal) {
247                            String vej = googleHelper.proposeStreetName(request, result);          
248                            gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
249                    }
250                    return gadeident;
251            }
252                    
253          private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) {          private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) {
254                  if (vej == null)                  if (vej == null)
# Line 213  public class AddressSearch { Line 278  public class AddressSearch {
278                  long start1 = System.currentTimeMillis();                  long start1 = System.currentTimeMillis();
279                  System.out.println("Build -- stage 1");                  System.out.println("Build -- stage 1");
280                                    
281                  alleAdresser = DatabaseLayer.getAllAdresses();                  alleAdresser = db.getAllAdresses();
282                                    
283                                    
284                  /* Mapper mellem db Row ID og adresse noden */                  /* Mapper mellem db Row ID og adresse noden */
# Line 264  public class AddressSearch { Line 329  public class AddressSearch {
329                  System.out.println("Build -- stage 2 alias tabel");                  System.out.println("Build -- stage 2 alias tabel");
330                                    
331                  int vaskCount = 0;                  int vaskCount = 0;
332                  List<AliasBean> aliasList = DatabaseLayer.getAliasList();                  List<AliasBean> aliasList = db.getAliasList();
333                  for (AliasBean alias : aliasList) {                  for (AliasBean alias : aliasList) {
334                          Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr);                          Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr);
335                                                    
# Line 301  public class AddressSearch { Line 366  public class AddressSearch {
366                  DeduplicateHelper<String> ruteHelper = new DeduplicateHelper<String>();                  DeduplicateHelper<String> ruteHelper = new DeduplicateHelper<String>();
367                  DeduplicateHelper<String> korelisteHelper = new DeduplicateHelper<String>();                  DeduplicateHelper<String> korelisteHelper = new DeduplicateHelper<String>();
368                                    
369                  List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist();                  List<ExtendedBean> extDao = db.getExtendedAdresslist();
370                  for (ExtendedBean eb : extDao) {                  for (ExtendedBean eb : extDao) {
371                                                    
372                          Address orgAddress = idAddressMap.get(eb.orgId);                                                  Address orgAddress = idAddressMap.get(eb.orgId);                        
# Line 375  public class AddressSearch { Line 440  public class AddressSearch {
440                  System.out.println("Build, stage3 elapsed: " + (start4-start3) );                  System.out.println("Build, stage3 elapsed: " + (start4-start3) );
441                  System.out.println("Build -- stage 4 - 100pct");                  System.out.println("Build -- stage 4 - 100pct");
442                                    
443                  Map<Short,HundredePctBean> hundredePct = DatabaseLayer.get100PctList();                  Map<Short,HundredePctBean> hundredePct = db.get100PctList();
444                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
445                          if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                                                  if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) {                        
446                                  continue;                                  continue;
# Line 400  public class AddressSearch { Line 465  public class AddressSearch {
465                                    
466                  ////////////////////////////////////////////////////////////////////////////////////                  ////////////////////////////////////////////////////////////////////////////////////
467                  long stop = System.currentTimeMillis();                  long stop = System.currentTimeMillis();
468                  System.out.println("Build, stage3 elapsed: " + (stop-start4) );                  System.out.println("Build, stage4 elapsed: " + (stop-start4) );
469                  System.out.println("Build -- Gathering statistics");                  System.out.println("Build -- Gathering statistics");
470                                                                    
471                  for (Address addr : alleAdresser) {                  for (Address addr : alleAdresser) {
# Line 418  public class AddressSearch { Line 483  public class AddressSearch {
483                                  stats.ikkeDaekketCount++;                                  stats.ikkeDaekketCount++;
484                          }                          }
485                  }                                }              
486                    stats.totalCount = alleAdresser.size();
487                                    
488                                    
489                  stats.elapsed = stop-start1;                              stats.elapsed = stop-start1;            
490                  stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );                  stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
491                                    
492                    System.out.println("Build: totalCount: " + stats.totalCount);
493                  System.out.println("Build: direkteCount: " + stats.direkteCount);                  System.out.println("Build: direkteCount: " + stats.direkteCount);
494                  System.out.println("Build: extendedCount: " + stats.extendedCount);                  System.out.println("Build: extendedCount: " + stats.extendedCount);
495                  System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);                  System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
# Line 437  public class AddressSearch { Line 504  public class AddressSearch {
504                  return stats;                  return stats;
505          }          }
506                    
507            public DatabaseLayer getDatabaseLayer() {
508                    return db;
509            }
510            
511          public void clear() {          public void clear() {
512                  searchPostnrVejnavnGadeid.clear();                  searchPostnrVejnavnGadeid.clear();
513                  searchGadeidentAdresser.clear();                  searchGadeidentAdresser.clear();
# Line 459  public class AddressSearch { Line 530  public class AddressSearch {
530                                  return ".." + targetAddress.rute;                                  return ".." + targetAddress.rute;
531                          } else if (eb.afstand < 0.701) {                          } else if (eb.afstand < 0.701) {
532                                  return "..." + targetAddress.rute;                                  return "..." + targetAddress.rute;
533                          } else if (eb.afstand < 0.501) {                          } else if (eb.afstand < 1.001) {
534                                  return "...." + targetAddress.rute;                                  return "...." + targetAddress.rute;
535                          }                          }
536                          break;                                            break;                  
# Line 485  public class AddressSearch { Line 556  public class AddressSearch {
556                                  return "...." + targetAddress.rute;                                  return "...." + targetAddress.rute;
557                          }                          }
558                          break;                          break;
559                    default:
560                            System.out.println("Ukendt transport type: " + eb );
561                  }                                }              
562                  return null;                  return null;
563          }          }
# Line 500  public class AddressSearch { Line 573  public class AddressSearch {
573                  return result;                  return result;
574          }          }
575                    
576            public List<Address> get100PctAddresses() {
577                    List<Address> result = new ArrayList<Address>(120000);
578                    for (Address a : alleAdresser) {
579                            if ( a.daekningsType == DaekningsType.DAEKNING_100PCT) {
580                                    result.add(a);
581                            }
582                    }
583                    Collections.sort(result );
584                    return result;
585            }
586            
587          ///////////////////////////////////////////////////////////          ///////////////////////////////////////////////////////////
588          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {          private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) {
589                  String inject;                  String inject;
# Line 515  public class AddressSearch { Line 599  public class AddressSearch {
599                  vejnavn = vejnavn.toLowerCase();                  vejnavn = vejnavn.toLowerCase();
600                  HashSet<String> aliasSet = new HashSet<String>();                  HashSet<String> aliasSet = new HashSet<String>();
601                  aliasSet.add(vejnavn);                  aliasSet.add(vejnavn);
602                                                    
                 aliasSet.add(vejnavn.replace("u", "ü") );  
                 aliasSet.add(vejnavn.replace("ü", "u") );  
                   
                 aliasSet.add(vejnavn.replace("ä", "æ") );  
                 aliasSet.add(vejnavn.replace("æ", "ä") );  
                   
603                  aliasSet.add(vejnavn.replace("alle", "allé") );                  aliasSet.add(vejnavn.replace("alle", "allé") );
604                  aliasSet.add(vejnavn.replace("allé", "alle") );                                  aliasSet.add(vejnavn.replace("allé", "alle") );                
605                                    
# Line 544  public class AddressSearch { Line 622  public class AddressSearch {
622                  aliasSet.add(vejnavn.replace("gl", "gammel") );                  aliasSet.add(vejnavn.replace("gl", "gammel") );
623                  aliasSet.add(vejnavn.replace("gammel", "gl") );                  aliasSet.add(vejnavn.replace("gammel", "gl") );
624                                    
625                    aliasSet.add(vejnavn.replace("gl", "gamle") );
626                    aliasSet.add(vejnavn.replace("gamle", "gl") );
627                    
628                  aliasSet.add(vejnavn.replace("lille", "ll") );                  aliasSet.add(vejnavn.replace("lille", "ll") );
629                  aliasSet.add(vejnavn.replace("ll ", "lille") );                  aliasSet.add(vejnavn.replace("ll ", "lille") );
630                  aliasSet.add(vejnavn.replace("ll.", "lille") );                  aliasSet.add(vejnavn.replace("ll.", "lille") );
# Line 553  public class AddressSearch { Line 634  public class AddressSearch {
634                  aliasSet.add(vejnavn.replace("st.", "store") );                  aliasSet.add(vejnavn.replace("st.", "store") );
635                                    
636                  aliasSet.add(vejnavn.replace("søndre", "sdr") );                  aliasSet.add(vejnavn.replace("søndre", "sdr") );
637                  aliasSet.add(vejnavn.replace("sdr", "søndre") );                  aliasSet.add(vejnavn.replace("sdr", "søndre") );              
638                    aliasSet.add(vejnavn.replace("sønder", "sdr") );
639                    aliasSet.add(vejnavn.replace("sdr", "sønder") );
640    
641                                    
642                  aliasSet.add(vejnavn.replace("nørre", "nr") );                  aliasSet.add(vejnavn.replace("nørre", "nr") );
# Line 589  public class AddressSearch { Line 672  public class AddressSearch {
672                  aliasSet.add(vejnavn.replace("john", "j") );                  aliasSet.add(vejnavn.replace("john", "j") );
673                  aliasSet.add(vejnavn.replace("thomas", "th") );                  aliasSet.add(vejnavn.replace("thomas", "th") );
674                  aliasSet.add(vejnavn.replace("thorvald", "th") );                  aliasSet.add(vejnavn.replace("thorvald", "th") );
675                    aliasSet.add(vejnavn.replace("frederik", "fr") );
676                    aliasSet.add(vejnavn.replace("frederiks", "fr") );
677                                    
678                                    
679                  aliasSet.add(vejnavn.replace("christian", "chr") );                  aliasSet.add(vejnavn.replace("christian", "chr") );
680                    aliasSet.add(vejnavn.replace("christians", "chr") );
681                  aliasSet.add(vejnavn.replace("kristian", "kr") );                  aliasSet.add(vejnavn.replace("kristian", "kr") );
682                    aliasSet.add(vejnavn.replace("kristians", "kr") );
683    
684                    aliasSet.add(vejnavn.replace("mylius", "myl") );
685                    aliasSet.add(vejnavn.replace("myl", "mylius") );
686                    
687                    aliasSet.add(vejnavn.replace("ludvig", "ludv") );
688                    aliasSet.add(vejnavn.replace("ludv", "ludvig") );
689                                    
690                                    
691                  // alternative stavninger                  // alternative stavninger
# Line 652  public class AddressSearch { Line 745  public class AddressSearch {
745                                    
746                  aliasSet.add(vejnavn.replace("plads", "pl") );                  aliasSet.add(vejnavn.replace("plads", "pl") );
747                  aliasSet.add(vejnavn.replace("vænget", "vænge") );                  aliasSet.add(vejnavn.replace("vænget", "vænge") );
748                    
749                    aliasSet.add(vejnavn.replace("boulevard", "blvd") );
750                    aliasSet.add(vejnavn.replace("blvd", "boulevard") );
751    
752                    aliasSet.add(vejnavn.replace("boulevard", "boule") );
753                    aliasSet.add(vejnavn.replace("boule", "boulevard") );
754                                    
755                    aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000
756                    aliasSet.add(vejnavn.replace("krbg", "kronborg") );
757                                    
758                  // Opbyg æøå varianter over alle fundne aliaser                  // Opbyg æøå varianter over alle fundne aliaser
759                                    
# Line 679  public class AddressSearch { Line 780  public class AddressSearch {
780                          //danske tegn 3                          //danske tegn 3
781                          aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );                          aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
782                          aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );                          aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
783                            
784                            
785                            //udenlandsketegn
786                            aliasSet.add(vejnavn.replace("u", "ü") );
787                            aliasSet.add(vejnavn.replace("ü", "u") );
788                            
789                            aliasSet.add(vejnavn.replace("ä", "æ") );
790                            aliasSet.add(vejnavn.replace("æ", "ä") );
791                            
792                            aliasSet.add(vejnavn.replace("ö", "ø") );
793                            aliasSet.add(vejnavn.replace("ø", "ö") );
794                  }                  }
795                                    
796                  return aliasSet;                  return aliasSet;
# Line 690  public class AddressSearch { Line 802  public class AddressSearch {
802                    
803          public Set<Entry<String,Integer>> getVejnavne(short postnr) {          public Set<Entry<String,Integer>> getVejnavne(short postnr) {
804                  Map<String,Integer> map = searchPostnrVejnavnGadeid.get(postnr);                  Map<String,Integer> map = searchPostnrVejnavnGadeid.get(postnr);
805                  TreeMap<String,Integer> newMap = new TreeMap<String,Integer>();                  
806                  for (Entry<String,Integer> entry : map.entrySet() ) {                  TreeMap<String,Integer> newMap = new TreeMap<String,Integer>( map );//Lav et nyt TreeMap for at sikre sortering
                         newMap.put(entry.getKey(), entry.getValue());  
                 }  
807                                    
808                  return newMap.entrySet();                  return newMap.entrySet();
809          }          }

Legend:
Removed from v.2552  
changed lines
  Added in v.2778

  ViewVC Help
Powered by ViewVC 1.1.20