27 |
import dk.daoas.daoadresseservice.beans.SearchResult; |
import dk.daoas.daoadresseservice.beans.SearchResult; |
28 |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
29 |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
30 |
|
import dk.daoas.daoadresseservice.util.DaoUtils; |
31 |
import dk.daoas.daoadresseservice.util.DeduplicateHelper; |
import dk.daoas.daoadresseservice.util.DeduplicateHelper; |
32 |
import dk.daoas.daoadresseservice.util.NaturalOrderComparator; |
import dk.daoas.daoadresseservice.util.NaturalOrderComparator; |
33 |
|
|
67 |
SearchRequest request = new SearchRequest(); |
SearchRequest request = new SearchRequest(); |
68 |
SearchResult result = new SearchResult(); |
SearchResult result = new SearchResult(); |
69 |
|
|
|
|
|
|
String helperSearchKey = ""; |
|
70 |
|
|
71 |
try { |
try { |
72 |
request.postnr = Short.parseShort(postnrStr); |
request.postnr = Short.parseShort(postnrStr); |
94 |
return result; |
return result; |
95 |
} |
} |
96 |
|
|
97 |
request.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
98 |
|
|
99 |
|
|
100 |
if (request.vasketVejnavn.indexOf("pakkebo") > -1 |
if (result.vasketVejnavn.indexOf("pakkebo") > -1 |
101 |
|| request.vasketVejnavn.indexOf("pakkepost") > -1 |
|| result.vasketVejnavn.indexOf("pakkepost") > -1 |
102 |
|| request.vasketVejnavn.indexOf("døgnpost") > -1 |
|| result.vasketVejnavn.indexOf("postbo") > -1 // postbox/postboks |
103 |
|| request.vasketVejnavn.indexOf("døgnbo") > -1 |
|| result.vasketVejnavn.indexOf("døgnpost") > -1 |
104 |
|| request.vasketVejnavn.equals("id") |
|| result.vasketVejnavn.indexOf("døgnbo") > -1 // døgnbox // døgnboks |
105 |
|
|| result.vasketVejnavn.equals("id") |
106 |
) { |
) { |
107 |
result.status = Status.ERROR_POSTBOX; |
result.status = Status.ERROR_POSTBOX; |
108 |
return result; |
return result; |
109 |
} |
} |
110 |
|
|
111 |
Integer gadeident = request.streetNames.get(request.vasketVejnavn); |
// LookupStreetname er en indkapsling af alm + levenstein + google + osm |
112 |
|
Integer gadeident = lookupStretname(request, result, true); |
113 |
|
|
|
if ( gadeident == null) { |
|
|
helperSearchKey = "" + request.postnr + "/" + request.vasketVejnavn; |
|
|
gadeident = helperCache.get(helperSearchKey); |
|
|
} |
|
114 |
|
|
115 |
|
/* |
116 |
|
* Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn |
117 |
|
* |
118 |
|
* <strike>Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt</strike>*/ |
119 |
if (gadeident == null) { |
if (gadeident == null) { |
120 |
String vej = levenshteinHelper.proposeStreetName(request, result); |
final int MAX_TRIES = 4; |
121 |
if (vej != null) { |
|
122 |
gadeident = request.streetNames.get(vej); |
String vejnavnParts[] = request.vejnavn.split(" "); |
123 |
} |
|
124 |
} |
for (int i=1; i<=MAX_TRIES && i<vejnavnParts.length; i++) { |
125 |
|
String subVejnavn = DaoUtils.joinHelper(vejnavnParts, i); |
126 |
|
|
127 |
// Brug OpenStreetMap før vi prøver google |
request.vejnavn = subVejnavn; |
128 |
// For google har en request limit, det har OSM ikke! |
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
129 |
if ( gadeident == null) { |
|
130 |
String vej = osmHelper.proposeStreetName(request, result); |
gadeident = lookupStretname(request, result, false);//prøv opslag MEN UDEN GOOGLE/OSM !!! |
131 |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
132 |
} |
//hvis vi fandt vejen ud fra substrengen |
133 |
|
if (gadeident != null) { |
134 |
if ( gadeident == null) { |
break; |
135 |
String vej = googleHelper.proposeStreetName(request, result); |
} |
136 |
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
|
137 |
|
//hvis vi ikke fandt kopierer vi vejnavn fra split igen |
138 |
|
request.vejnavn = result.splitResult.vej; |
139 |
|
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
140 |
|
} |
141 |
} |
} |
142 |
|
|
143 |
|
|
187 |
|
|
188 |
return result; |
return result; |
189 |
} |
} |
190 |
|
|
191 |
|
|
192 |
|
private Integer lookupStretname(SearchRequest request, SearchResult result, boolean useExternal) { |
193 |
|
String helperSearchKey = ""; |
194 |
|
|
195 |
|
Integer gadeident = request.streetNames.get(result.vasketVejnavn); |
196 |
|
|
197 |
|
|
198 |
|
if ( gadeident == null) { |
199 |
|
helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn; |
200 |
|
gadeident = helperCache.get(helperSearchKey); |
201 |
|
} |
202 |
|
|
203 |
|
if (gadeident == null) { |
204 |
|
String vej = levenshteinHelper.proposeStreetName(request, result); |
205 |
|
if (vej != null) { |
206 |
|
gadeident = request.streetNames.get(vej); |
207 |
|
} |
208 |
|
} |
209 |
|
|
210 |
|
|
211 |
|
// Brug OpenStreetMap før vi prøver google |
212 |
|
// For google har en request limit, det har OSM ikke! |
213 |
|
if ( gadeident == null && useExternal) { |
214 |
|
String vej = osmHelper.proposeStreetName(request, result); |
215 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
216 |
|
} |
217 |
|
|
218 |
|
if ( gadeident == null && useExternal) { |
219 |
|
String vej = googleHelper.proposeStreetName(request, result); |
220 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
221 |
|
} |
222 |
|
return gadeident; |
223 |
|
} |
224 |
|
|
225 |
private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) { |
private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) { |
226 |
if (vej == null) |
if (vej == null) |
236 |
|
|
237 |
} |
} |
238 |
|
|
239 |
public Map<String,Integer> getStretsByPostal(int zip) { |
public Map<String,Integer> getStretsByPostal(short zip) { |
240 |
return searchPostnrVejnavnGadeid.get(zip); |
return searchPostnrVejnavnGadeid.get(zip); |
241 |
} |
} |
242 |
|
|
395 |
orgAddress.dbkBane = targetAddress.dbkBane; |
orgAddress.dbkBane = targetAddress.dbkBane; |
396 |
|
|
397 |
/* Sådan gør den gamle service */ |
/* Sådan gør den gamle service */ |
398 |
orgAddress.kommunekode = targetAddress.kommunekode; |
/* 20150520 THN- hvis vi bibeholder de originale kommune+vejkoder kan vi bruge DAVID til join i databasen*/ |
399 |
orgAddress.vejkode = targetAddress.vejkode; |
//orgAddress.kommunekode = targetAddress.kommunekode; |
400 |
|
//orgAddress.vejkode = targetAddress.vejkode; |
401 |
|
|
402 |
|
|
403 |
orgAddress.distributor = targetAddress.distributor; |
orgAddress.distributor = targetAddress.distributor; |
404 |
} |
} |
455 |
stats.ikkeDaekketCount++; |
stats.ikkeDaekketCount++; |
456 |
} |
} |
457 |
} |
} |
458 |
|
stats.totalCount = alleAdresser.size(); |
459 |
|
|
460 |
|
|
461 |
stats.elapsed = stop-start1; |
stats.elapsed = stop-start1; |
462 |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
463 |
|
|
464 |
|
System.out.println("Build: totalCount: " + stats.totalCount); |
465 |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
466 |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
467 |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
554 |
vejnavn = vejnavn.toLowerCase(); |
vejnavn = vejnavn.toLowerCase(); |
555 |
HashSet<String> aliasSet = new HashSet<String>(); |
HashSet<String> aliasSet = new HashSet<String>(); |
556 |
aliasSet.add(vejnavn); |
aliasSet.add(vejnavn); |
557 |
|
|
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
|
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
|
|
|
|
558 |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
559 |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
560 |
|
|
586 |
aliasSet.add(vejnavn.replace("st.", "store") ); |
aliasSet.add(vejnavn.replace("st.", "store") ); |
587 |
|
|
588 |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
589 |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
590 |
|
aliasSet.add(vejnavn.replace("sønder", "sdr") ); |
591 |
|
aliasSet.add(vejnavn.replace("sdr", "sønder") ); |
592 |
|
|
593 |
|
|
594 |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
597 |
aliasSet.add(vejnavn.replace("nordre", "ndr") ); |
aliasSet.add(vejnavn.replace("nordre", "ndr") ); |
598 |
aliasSet.add(vejnavn.replace("ndr", "nordre") ); |
aliasSet.add(vejnavn.replace("ndr", "nordre") ); |
599 |
|
|
600 |
|
|
601 |
|
aliasSet.add(vejnavn.replace("vestre", "vester") ); |
602 |
|
aliasSet.add(vejnavn.replace("vester", "vestre") ); |
603 |
|
|
604 |
|
aliasSet.add(vejnavn.replace("søndre", "sønder") ); |
605 |
|
aliasSet.add(vejnavn.replace("sønder", "søndre") ); |
606 |
|
|
607 |
|
aliasSet.add(vejnavn.replace("østre", "øster") ); |
608 |
|
aliasSet.add(vejnavn.replace("øster", "østre") ); |
609 |
|
|
610 |
aliasSet.add(vejnavn.replace("borgmester", "borgm") ); |
aliasSet.add(vejnavn.replace("borgmester", "borgm") ); |
611 |
aliasSet.add(vejnavn.replace("borgm", "borgmester") ); |
aliasSet.add(vejnavn.replace("borgm", "borgmester") ); |
612 |
|
|
624 |
aliasSet.add(vejnavn.replace("john", "j") ); |
aliasSet.add(vejnavn.replace("john", "j") ); |
625 |
aliasSet.add(vejnavn.replace("thomas", "th") ); |
aliasSet.add(vejnavn.replace("thomas", "th") ); |
626 |
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
627 |
|
aliasSet.add(vejnavn.replace("frederik", "fr") ); |
628 |
|
aliasSet.add(vejnavn.replace("frederiks", "fr") ); |
629 |
|
|
630 |
|
|
631 |
aliasSet.add(vejnavn.replace("christian", "chr") ); |
aliasSet.add(vejnavn.replace("christian", "chr") ); |
632 |
|
aliasSet.add(vejnavn.replace("christians", "chr") ); |
633 |
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
634 |
|
aliasSet.add(vejnavn.replace("kristians", "kr") ); |
635 |
|
|
636 |
|
|
637 |
// alternative stavninger |
// alternative stavninger |
691 |
|
|
692 |
aliasSet.add(vejnavn.replace("plads", "pl") ); |
aliasSet.add(vejnavn.replace("plads", "pl") ); |
693 |
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
694 |
|
|
695 |
|
aliasSet.add(vejnavn.replace("boulevard", "blvd") ); |
696 |
|
aliasSet.add(vejnavn.replace("blvd", "boulevard") ); |
697 |
|
|
698 |
|
aliasSet.add(vejnavn.replace("boulevard", "boule") ); |
699 |
|
aliasSet.add(vejnavn.replace("boule", "boulevard") ); |
700 |
|
|
701 |
|
aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 |
702 |
|
aliasSet.add(vejnavn.replace("krbg", "kronborg") ); |
703 |
|
|
704 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
705 |
|
|
726 |
//danske tegn 3 |
//danske tegn 3 |
727 |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
728 |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
729 |
|
|
730 |
|
|
731 |
|
//udenlandsketegn |
732 |
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
733 |
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
734 |
|
|
735 |
|
aliasSet.add(vejnavn.replace("ä", "æ") ); |
736 |
|
aliasSet.add(vejnavn.replace("æ", "ä") ); |
737 |
|
|
738 |
|
aliasSet.add(vejnavn.replace("ö", "ø") ); |
739 |
|
aliasSet.add(vejnavn.replace("ø", "ö") ); |
740 |
} |
} |
741 |
|
|
742 |
return aliasSet; |
return aliasSet; |