/[projects]/dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java
ViewVC logotype

Diff of /dao/DaoAdresseService/src/main/java/dk/daoas/daoadresseservice/AddressSearch.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2549 by torben, Wed May 20 09:10:34 2015 UTC revision 2598 by torben, Mon Jul 13 10:32:11 2015 UTC
# Line 27  import dk.daoas.daoadresseservice.beans. Line 27  import dk.daoas.daoadresseservice.beans.
27  import dk.daoas.daoadresseservice.beans.SearchResult;  import dk.daoas.daoadresseservice.beans.SearchResult;
28  import dk.daoas.daoadresseservice.beans.SearchResult.Status;  import dk.daoas.daoadresseservice.beans.SearchResult.Status;
29  import dk.daoas.daoadresseservice.db.DatabaseLayer;  import dk.daoas.daoadresseservice.db.DatabaseLayer;
30    import dk.daoas.daoadresseservice.util.DaoUtils;
31  import dk.daoas.daoadresseservice.util.DeduplicateHelper;  import dk.daoas.daoadresseservice.util.DeduplicateHelper;
32  import dk.daoas.daoadresseservice.util.NaturalOrderComparator;  import dk.daoas.daoadresseservice.util.NaturalOrderComparator;
33    
# Line 66  public class AddressSearch { Line 67  public class AddressSearch {
67                  SearchRequest request = new SearchRequest();                  SearchRequest request = new SearchRequest();
68                  SearchResult result = new SearchResult();                  SearchResult result = new SearchResult();
69                                    
   
                 String helperSearchKey = "";  
70                                    
71                  try {                  try {
72                          request.postnr = Short.parseShort(postnrStr);                          request.postnr = Short.parseShort(postnrStr);
# Line 95  public class AddressSearch { Line 94  public class AddressSearch {
94                          return result;                          return result;
95                  }                  }
96                                    
97                  request.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );                  result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );
98                                    
99    
100                  if (request.vasketVejnavn.indexOf("pakkebo") > -1                  if (result.vasketVejnavn.indexOf("pakkebo") > -1
101                                  || request.vasketVejnavn.indexOf("pakkepost") > -1                                  || result.vasketVejnavn.indexOf("pakkepost") > -1
102                                  || request.vasketVejnavn.indexOf("postbo") > -1   // postbox/postboks                                  || result.vasketVejnavn.indexOf("postbo") > -1   // postbox/postboks
103                                  || request.vasketVejnavn.indexOf("døgnpost") > -1                                  || result.vasketVejnavn.indexOf("døgnpost") > -1
104                                  || request.vasketVejnavn.indexOf("døgnbo") > -1 // døgnbox // døgnboks                                  || result.vasketVejnavn.indexOf("døgnbo") > -1 // døgnbox // døgnboks
105                                  || request.vasketVejnavn.equals("id")                                  || result.vasketVejnavn.equals("id")
106                                  ) {                                  ) {
107                          result.status = Status.ERROR_POSTBOX;                          result.status = Status.ERROR_POSTBOX;
108                          return result;                                            return result;                  
109                  }                  }
110                                    
111                  Integer gadeident =  request.streetNames.get(request.vasketVejnavn);                  // LookupStreetname er en indkapsling af alm + levenstein + google + osm
112                                    Integer gadeident = lookupStretname(request, result, true);
113                                    
                 if ( gadeident == null) {  
                         helperSearchKey = "" + request.postnr + "/" + request.vasketVejnavn;  
                         gadeident = helperCache.get(helperSearchKey);  
                 }  
114                                    
115                    /*
116                     * Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn
117                     *
118                     * <strike>Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt</strike>*/
119                  if (gadeident == null) {                  if (gadeident == null) {
120                          String vej = levenshteinHelper.proposeStreetName(request, result);                          final int MAX_TRIES = 4;
121                          if (vej != null) {                          
122                                  gadeident =  request.streetNames.get(vej);                          String vejnavnParts[] = request.vejnavn.split(" ");
123                          }                          
124                  }                          for (int i=1; i<=MAX_TRIES && i<vejnavnParts.length; i++) {
125                                                    String subVejnavn = DaoUtils.joinHelper(vejnavnParts, i);
126                                                    
127                  // Brug OpenStreetMap før vi prøver google                                  request.vejnavn = subVejnavn;
128                  // For google har en request limit, det har OSM ikke!                                  result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );
129                  if ( gadeident == null) {                                  
130                          String vej = osmHelper.proposeStreetName(request, result);                                                gadeident = lookupStretname(request, result, false);//prøv opslag MEN UDEN GOOGLE/OSM !!!
131                          gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);                                  
132                  }                                  //hvis vi fandt vejen ud fra substrengen
133                                                    if (gadeident != null) {
134                  if ( gadeident == null) {                                          break;
135                          String vej = googleHelper.proposeStreetName(request, result);                                            }                      
136                          gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);                                  
137                                    //hvis vi ikke fandt kopierer vi vejnavn fra split igen
138                                    request.vejnavn = result.splitResult.vej;
139                                    result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn );
140                            }                      
141                  }                  }
142                                    
143    
# Line 184  public class AddressSearch { Line 187  public class AddressSearch {
187    
188                  return result;                  return result;
189          }          }
190    
191    
192            private Integer lookupStretname(SearchRequest request, SearchResult result, boolean useExternal) {
193                    String helperSearchKey = "";
194                    
195                    Integer gadeident =  request.streetNames.get(result.vasketVejnavn);
196                    
197                    
198                    if ( gadeident == null) {
199                            helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn;
200                            gadeident = helperCache.get(helperSearchKey);
201                    }
202                    
203                    if (gadeident == null) {
204                            String vej = levenshteinHelper.proposeStreetName(request, result);
205                            if (vej != null) {
206                                    gadeident =  request.streetNames.get(vej);
207                            }
208                    }
209                    
210                    
211                    // Brug OpenStreetMap før vi prøver google
212                    // For google har en request limit, det har OSM ikke!
213                    if ( gadeident == null && useExternal) {
214                            String vej = osmHelper.proposeStreetName(request, result);              
215                            gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
216                    }
217                    
218                    if ( gadeident == null && useExternal) {
219                            String vej = googleHelper.proposeStreetName(request, result);          
220                            gadeident = helperWrapper(vej, request.streetNames, helperSearchKey);
221                    }
222                    return gadeident;
223            }
224                    
225          private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) {          private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) {
226                  if (vej == null)                  if (vej == null)
# Line 418  public class AddressSearch { Line 455  public class AddressSearch {
455                                  stats.ikkeDaekketCount++;                                  stats.ikkeDaekketCount++;
456                          }                          }
457                  }                                }              
458                    stats.totalCount = alleAdresser.size();
459                                    
460                                    
461                  stats.elapsed = stop-start1;                              stats.elapsed = stop-start1;            
462                  stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );                  stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() );
463                                    
464                    System.out.println("Build: totalCount: " + stats.totalCount);
465                  System.out.println("Build: direkteCount: " + stats.direkteCount);                  System.out.println("Build: direkteCount: " + stats.direkteCount);
466                  System.out.println("Build: extendedCount: " + stats.extendedCount);                  System.out.println("Build: extendedCount: " + stats.extendedCount);
467                  System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);                  System.out.println("Build: hundredePctCount: " + stats.hundredePctCount);
# Line 515  public class AddressSearch { Line 554  public class AddressSearch {
554                  vejnavn = vejnavn.toLowerCase();                  vejnavn = vejnavn.toLowerCase();
555                  HashSet<String> aliasSet = new HashSet<String>();                  HashSet<String> aliasSet = new HashSet<String>();
556                  aliasSet.add(vejnavn);                  aliasSet.add(vejnavn);
557                                                    
                 aliasSet.add(vejnavn.replace("u", "ü") );  
                 aliasSet.add(vejnavn.replace("ü", "u") );  
                   
558                  aliasSet.add(vejnavn.replace("alle", "allé") );                  aliasSet.add(vejnavn.replace("alle", "allé") );
559                  aliasSet.add(vejnavn.replace("allé", "alle") );                                  aliasSet.add(vejnavn.replace("allé", "alle") );                
560                                    
# Line 550  public class AddressSearch { Line 586  public class AddressSearch {
586                  aliasSet.add(vejnavn.replace("st.", "store") );                  aliasSet.add(vejnavn.replace("st.", "store") );
587                                    
588                  aliasSet.add(vejnavn.replace("søndre", "sdr") );                  aliasSet.add(vejnavn.replace("søndre", "sdr") );
589                  aliasSet.add(vejnavn.replace("sdr", "søndre") );                  aliasSet.add(vejnavn.replace("sdr", "søndre") );              
590                    aliasSet.add(vejnavn.replace("sønder", "sdr") );
591                    aliasSet.add(vejnavn.replace("sdr", "sønder") );
592    
593                                    
594                  aliasSet.add(vejnavn.replace("nørre", "nr") );                  aliasSet.add(vejnavn.replace("nørre", "nr") );
# Line 559  public class AddressSearch { Line 597  public class AddressSearch {
597                  aliasSet.add(vejnavn.replace("nordre", "ndr") );                  aliasSet.add(vejnavn.replace("nordre", "ndr") );
598                  aliasSet.add(vejnavn.replace("ndr", "nordre") );                  aliasSet.add(vejnavn.replace("ndr", "nordre") );
599                                    
600                    
601                    aliasSet.add(vejnavn.replace("vestre", "vester") );
602                    aliasSet.add(vejnavn.replace("vester", "vestre") );
603                    
604                    aliasSet.add(vejnavn.replace("søndre", "sønder") );
605                    aliasSet.add(vejnavn.replace("sønder", "søndre") );
606                    
607                    aliasSet.add(vejnavn.replace("østre", "øster") );
608                    aliasSet.add(vejnavn.replace("øster", "østre") );
609                    
610                  aliasSet.add(vejnavn.replace("borgmester", "borgm") );                  aliasSet.add(vejnavn.replace("borgmester", "borgm") );
611                  aliasSet.add(vejnavn.replace("borgm", "borgmester") );                  aliasSet.add(vejnavn.replace("borgm", "borgmester") );
612                                    
# Line 576  public class AddressSearch { Line 624  public class AddressSearch {
624                  aliasSet.add(vejnavn.replace("john", "j") );                  aliasSet.add(vejnavn.replace("john", "j") );
625                  aliasSet.add(vejnavn.replace("thomas", "th") );                  aliasSet.add(vejnavn.replace("thomas", "th") );
626                  aliasSet.add(vejnavn.replace("thorvald", "th") );                  aliasSet.add(vejnavn.replace("thorvald", "th") );
627                    aliasSet.add(vejnavn.replace("frederik", "fr") );
628                    aliasSet.add(vejnavn.replace("frederiks", "fr") );
629                                    
630                                    
631                  aliasSet.add(vejnavn.replace("christian", "chr") );                  aliasSet.add(vejnavn.replace("christian", "chr") );
632                    aliasSet.add(vejnavn.replace("christians", "chr") );
633                  aliasSet.add(vejnavn.replace("kristian", "kr") );                  aliasSet.add(vejnavn.replace("kristian", "kr") );
634                    aliasSet.add(vejnavn.replace("kristians", "kr") );
635                                    
636                                    
637                  // alternative stavninger                  // alternative stavninger
# Line 639  public class AddressSearch { Line 691  public class AddressSearch {
691                                    
692                  aliasSet.add(vejnavn.replace("plads", "pl") );                  aliasSet.add(vejnavn.replace("plads", "pl") );
693                  aliasSet.add(vejnavn.replace("vænget", "vænge") );                  aliasSet.add(vejnavn.replace("vænget", "vænge") );
694                    
695                    aliasSet.add(vejnavn.replace("boulevard", "blvd") );
696                    aliasSet.add(vejnavn.replace("blvd", "boulevard") );
697    
698                    aliasSet.add(vejnavn.replace("boulevard", "boule") );
699                    aliasSet.add(vejnavn.replace("boule", "boulevard") );
700                                    
701                  // Opbyg æøå varianter over alle fundne aliaser                  // Opbyg æøå varianter over alle fundne aliaser
702                                    
# Line 666  public class AddressSearch { Line 723  public class AddressSearch {
723                          //danske tegn 3                          //danske tegn 3
724                          aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );                          aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") );
725                          aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );                          aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") );
726                            
727                            
728                            //udenlandsketegn
729                            aliasSet.add(vejnavn.replace("u", "ü") );
730                            aliasSet.add(vejnavn.replace("ü", "u") );
731                            
732                            aliasSet.add(vejnavn.replace("ä", "æ") );
733                            aliasSet.add(vejnavn.replace("æ", "ä") );
734                            
735                            aliasSet.add(vejnavn.replace("ö", "ø") );
736                            aliasSet.add(vejnavn.replace("ø", "ö") );
737                  }                  }
738                                    
739                  return aliasSet;                  return aliasSet;

Legend:
Removed from v.2549  
changed lines
  Added in v.2598

  ViewVC Help
Powered by ViewVC 1.1.20