9 |
import java.util.HashSet; |
import java.util.HashSet; |
10 |
import java.util.List; |
import java.util.List; |
11 |
import java.util.Map; |
import java.util.Map; |
12 |
|
import java.util.Map.Entry; |
13 |
import java.util.Set; |
import java.util.Set; |
14 |
|
import java.util.TreeMap; |
15 |
|
import java.util.TreeSet; |
16 |
import java.util.concurrent.ConcurrentHashMap; |
import java.util.concurrent.ConcurrentHashMap; |
17 |
|
|
18 |
import org.apache.commons.lang3.StringUtils; |
import org.apache.commons.lang3.StringUtils; |
19 |
|
|
20 |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
import dk.daoas.daoadresseservice.admin.ServiceConfig; |
21 |
import dk.daoas.daoadresseservice.beans.Address; |
import dk.daoas.daoadresseservice.beans.Address; |
22 |
|
import dk.daoas.daoadresseservice.beans.AliasBean; |
23 |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
import dk.daoas.daoadresseservice.beans.DataStatisticsBean; |
24 |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
import dk.daoas.daoadresseservice.beans.ExtendedBean; |
25 |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
import dk.daoas.daoadresseservice.beans.HundredePctBean; |
26 |
|
import dk.daoas.daoadresseservice.beans.SearchRequest; |
27 |
import dk.daoas.daoadresseservice.beans.SearchResult; |
import dk.daoas.daoadresseservice.beans.SearchResult; |
28 |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
import dk.daoas.daoadresseservice.beans.SearchResult.Status; |
29 |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
import dk.daoas.daoadresseservice.db.DatabaseLayer; |
30 |
|
import dk.daoas.daoadresseservice.util.DaoUtils; |
31 |
|
import dk.daoas.daoadresseservice.util.DeduplicateHelper; |
32 |
|
import dk.daoas.daoadresseservice.util.NaturalOrderComparator; |
33 |
|
|
34 |
public class AdressSearch { |
public class AddressSearch { |
35 |
|
|
36 |
private Map<Integer, Map<String,Long>> searchPostnrVejnavnGadeid; |
private Map<Short, Map<String,Integer>> searchPostnrVejnavnGadeid; |
37 |
private Map<Long, Map<String,Address>> searchGadeidentAdresser; |
private Map<Integer, Map<String,Address>> searchGadeidentAdresser; |
38 |
|
|
39 |
private List<Address> alleAdresser; |
private List<Address> alleAdresser; |
40 |
|
|
41 |
private Map<String,Long> helperCache; |
private Map<String,Integer> helperCache; |
42 |
|
|
43 |
private DataStatisticsBean stats = new DataStatisticsBean(); |
private DataStatisticsBean stats = new DataStatisticsBean(); |
44 |
|
|
45 |
ServiceConfig config; |
private DatabaseLayer db; |
46 |
|
|
47 |
public AdressSearch(ServiceConfig config) { |
|
48 |
this.config = config; |
StreetnameHelper levenshteinHelper; |
49 |
|
StreetnameHelper googleHelper; |
50 |
|
StreetnameHelper osmHelper; |
51 |
|
|
52 |
|
|
53 |
|
public AddressSearch(DatabaseLayer db, ServiceConfig config) { |
54 |
|
|
55 |
|
this.db = db; |
56 |
|
|
57 |
|
levenshteinHelper = new LevenshteinStreetnameHelper( this ); |
58 |
|
googleHelper = new GoogleStreetnameHelper( config ); |
59 |
|
osmHelper = new OSMStreetnameHelper( config ); |
60 |
|
} |
61 |
|
|
62 |
|
public Address getAddressSafe(int gadeid, String husnr) throws Exception { |
63 |
|
|
64 |
|
Map<String,Address> gade = searchGadeidentAdresser.get(gadeid); |
65 |
|
|
66 |
|
if (gade == null) { |
67 |
|
throw new Exception("GadeID ikke fundet"); |
68 |
|
} |
69 |
|
|
70 |
|
Address addr = gade.get(husnr); |
71 |
|
|
72 |
|
if (addr == null) { |
73 |
|
throw new Exception("Adresse ikke ikke fundet"); |
74 |
|
} |
75 |
|
|
76 |
|
return addr; |
77 |
} |
} |
78 |
|
|
79 |
|
|
80 |
public SearchResult search(String postnrStr, String adresse) { |
public SearchResult search(String postnrStr, String adresse) { |
81 |
|
|
82 |
|
postnrStr = postnrStr.trim(); |
83 |
|
adresse = adresse.trim(); |
84 |
|
|
85 |
|
|
86 |
|
SearchRequest request = new SearchRequest(); |
87 |
SearchResult result = new SearchResult(); |
SearchResult result = new SearchResult(); |
88 |
|
|
|
int postnr=0; |
|
|
|
|
|
String helperSearchKey = ""; |
|
89 |
|
|
90 |
try { |
try { |
91 |
postnr = Integer.parseInt(postnrStr); |
request.postnr = Short.parseShort(postnrStr); |
92 |
} catch (Exception E) { |
} catch (Exception E) { |
93 |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
94 |
return result; |
return result; |
95 |
} |
} |
96 |
|
|
|
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(postnr); |
|
97 |
|
|
98 |
if (postnrVeje == null) { |
request.streetNames = searchPostnrVejnavnGadeid.get(request.postnr); |
99 |
|
|
100 |
|
if (request.streetNames == null) { |
101 |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
result.status = Status.ERROR_UNKNOWN_POSTAL; |
102 |
return result; |
return result; |
103 |
} |
} |
104 |
|
|
105 |
|
|
106 |
result.splitResult = AddressUtils.splitAdresse(adresse); |
result.splitResult = AddressUtils.splitAdresse(adresse); |
107 |
|
request.vejnavn = result.splitResult.vej; |
108 |
|
|
109 |
|
|
110 |
|
|
111 |
if (result.splitResult.husnr.length() == 0) { |
if (result.splitResult.husnr.length() == 0) { |
113 |
return result; |
return result; |
114 |
} |
} |
115 |
|
|
116 |
String vasketVejnavn = AddressUtils.vaskVejnavn( result.splitResult.vej ); |
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
|
|
|
|
Long gadeident = postnrVeje.get(vasketVejnavn); |
|
|
|
|
|
|
|
|
if ( gadeident == null) { |
|
|
helperSearchKey = "" + postnr + "/" + vasketVejnavn; |
|
|
gadeident = helperCache.get(helperSearchKey); |
|
|
} |
|
117 |
|
|
118 |
if (gadeident == null) { |
|
119 |
String best = getbestLevenshteinDistance(vasketVejnavn, postnrVeje); |
if (result.vasketVejnavn.indexOf("pakkebo") > -1 |
120 |
if (best != null) { |
|| result.vasketVejnavn.indexOf("pakkepost") > -1 |
121 |
gadeident = postnrVeje.get(best); |
|| result.vasketVejnavn.indexOf("postbo") > -1 // postbox/postboks |
122 |
} |
|| result.vasketVejnavn.indexOf("døgnpost") > -1 |
123 |
|
|| result.vasketVejnavn.indexOf("døgnbo") > -1 // døgnbox // døgnboks |
124 |
|
|| result.vasketVejnavn.equals("id") |
125 |
|
) { |
126 |
|
result.status = Status.ERROR_POSTBOX; |
127 |
|
return result; |
128 |
} |
} |
129 |
|
|
130 |
|
// LookupStreetname er en indkapsling af alm + levenstein + google + osm |
131 |
|
Integer gadeident = lookupStretname(request, result, true); |
132 |
|
|
|
// Brug OpenStreetMap før vi prøver google |
|
|
// For google har en request limit, det har OSM ikke! |
|
|
if ( gadeident == null) { |
|
|
if (config.useOpenStreetMaps) { |
|
|
result.osmVej = GeocodeHelper.openstreetmapHelper(config, postnr, result.splitResult.vej ); |
|
|
result.osm = true; |
|
|
|
|
|
if (result.osmVej != null) { |
|
|
String osmVasket = AddressUtils.vaskVejnavn( result.osmVej ); |
|
|
gadeident = postnrVeje.get(osmVasket); |
|
|
|
|
|
if (gadeident != null) { |
|
|
helperCache.put(helperSearchKey, gadeident); |
|
|
} |
|
|
} |
|
|
} |
|
|
} |
|
133 |
|
|
134 |
if ( gadeident == null) { |
/* |
135 |
if (config.useGoogle) { |
* Hvis der ikke er direkte hits, prøver vi at skære ord af vejnavn |
136 |
result.googleVej = GeocodeHelper.googleHelper(config, postnr, result.splitResult.vej ); |
* |
137 |
result.google = true; |
* <strike>Denne sektion er MEGET experimental da den øger antallet af kald til google/OSM væsentligt</strike>*/ |
138 |
|
if (gadeident == null) { |
139 |
if (result.googleVej != null) { |
final int MAX_TRIES = 4; |
140 |
String googleVasket = AddressUtils.vaskVejnavn( result.googleVej ); |
|
141 |
gadeident = postnrVeje.get(googleVasket); |
String vejnavnParts[] = request.vejnavn.split(" "); |
142 |
|
|
143 |
if (gadeident != null) { |
for (int i=1; i<=MAX_TRIES && i<vejnavnParts.length; i++) { |
144 |
helperCache.put(helperSearchKey, gadeident); |
String subVejnavn = DaoUtils.joinHelper(vejnavnParts, i); |
145 |
} |
|
146 |
} |
request.vejnavn = subVejnavn; |
147 |
} |
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
148 |
|
|
149 |
|
gadeident = lookupStretname(request, result, false);//prøv opslag MEN UDEN GOOGLE/OSM !!! |
150 |
|
|
151 |
|
//hvis vi fandt vejen ud fra substrengen |
152 |
|
if (gadeident != null) { |
153 |
|
break; |
154 |
|
} |
155 |
|
|
156 |
|
//hvis vi ikke fandt kopierer vi vejnavn fra split igen |
157 |
|
request.vejnavn = result.splitResult.vej; |
158 |
|
result.vasketVejnavn = AddressUtils.vaskVejnavn( request.vejnavn ); |
159 |
|
} |
160 |
} |
} |
161 |
|
|
162 |
|
|
166 |
return result; |
return result; |
167 |
} |
} |
168 |
|
|
169 |
|
result.gadeident = gadeident; |
170 |
|
|
171 |
|
|
172 |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
173 |
if (gade == null) { //Denne søgning må ikke fejle |
if (gade == null) { //Denne søgning må ikke fejle |
174 |
result.status = Status.ERROR_INTERNAL; |
result.status = Status.ERROR_INTERNAL; |
176 |
} |
} |
177 |
|
|
178 |
|
|
179 |
|
//Kunne evt klares med Iterables.get fra Guava/Collections |
180 |
|
Address firstAddress = gade.values().iterator().next(); |
181 |
|
result.vej = firstAddress.vejnavn; |
182 |
|
|
183 |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
String husnrSearch = "" + result.splitResult.husnr + result.splitResult.litra; |
184 |
Address addr = gade.get(husnrSearch); |
Address addr = gade.get(husnrSearch); |
185 |
|
|
206 |
|
|
207 |
return result; |
return result; |
208 |
} |
} |
209 |
|
|
210 |
|
|
211 |
|
private Integer lookupStretname(SearchRequest request, SearchResult result, boolean useExternal) { |
212 |
|
String helperSearchKey = ""; |
213 |
|
|
214 |
|
Integer gadeident = request.streetNames.get(result.vasketVejnavn); |
215 |
|
|
216 |
|
|
217 |
|
if ( gadeident == null) { |
218 |
|
helperSearchKey = "" + request.postnr + "/" + result.vasketVejnavn; |
219 |
|
gadeident = helperCache.get(helperSearchKey); |
220 |
|
} |
221 |
|
|
222 |
|
if (gadeident == null) { |
223 |
|
String vej = levenshteinHelper.proposeStreetName(request, result); |
224 |
|
if (vej != null) { |
225 |
|
gadeident = request.streetNames.get(vej); |
226 |
|
} |
227 |
|
} |
228 |
|
|
229 |
|
|
230 |
|
// Brug OpenStreetMap før vi prøver google |
231 |
|
// For google har en request limit, det har OSM ikke! |
232 |
|
if ( gadeident == null && useExternal) { |
233 |
|
String vej = osmHelper.proposeStreetName(request, result); |
234 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
235 |
|
} |
236 |
|
|
237 |
|
if ( gadeident == null && useExternal) { |
238 |
|
String vej = googleHelper.proposeStreetName(request, result); |
239 |
|
gadeident = helperWrapper(vej, request.streetNames, helperSearchKey); |
240 |
|
} |
241 |
|
return gadeident; |
242 |
|
} |
243 |
|
|
244 |
|
private Integer helperWrapper(String vej, Map<String,Integer> postnrVeje, String helperSearchKey) { |
245 |
|
if (vej == null) |
246 |
|
return null; |
247 |
|
|
248 |
|
String vejVasket = AddressUtils.vaskVejnavn( vej ); |
249 |
|
Integer gadeident = postnrVeje.get(vejVasket); |
250 |
|
|
251 |
|
if (gadeident != null) { |
252 |
|
helperCache.put(helperSearchKey, gadeident); |
253 |
|
} |
254 |
|
return gadeident; |
255 |
|
|
256 |
|
} |
257 |
|
|
258 |
|
public Map<String,Integer> getStretsByPostal(short zip) { |
259 |
|
return searchPostnrVejnavnGadeid.get(zip); |
260 |
|
} |
261 |
|
|
262 |
|
|
263 |
|
|
264 |
public void buildSearchStructures() throws SQLException{ |
public void buildSearchStructures() throws SQLException{ |
265 |
searchPostnrVejnavnGadeid = new HashMap<Integer, Map<String,Long>>(); |
searchPostnrVejnavnGadeid = new HashMap<Short, Map<String,Integer>>(); |
266 |
searchGadeidentAdresser = new HashMap<Long, Map<String,Address>>(); |
searchGadeidentAdresser = new HashMap<Integer, Map<String,Address>>(); |
267 |
helperCache = new ConcurrentHashMap<String,Long>(); |
helperCache = new ConcurrentHashMap<String,Integer>(); |
268 |
|
|
269 |
long start1 = System.currentTimeMillis(); |
long start1 = System.currentTimeMillis(); |
270 |
System.out.println("Build -- stage 1"); |
System.out.println("Build -- stage 1"); |
271 |
|
|
272 |
alleAdresser = DatabaseLayer.getAllAdresses(); |
alleAdresser = db.getAllAdresses(); |
273 |
|
|
274 |
|
|
275 |
/* Mapper mellem db Row ID og adresse noden */ |
/* Mapper mellem db Row ID og adresse noden */ |
276 |
Map<Integer,Address> idAddressMap = new HashMap<Integer,Address>( alleAdresser.size() ); |
Map<Integer,Address> idAddressMap = new HashMap<Integer,Address>( alleAdresser.size() ); |
277 |
|
DeduplicateHelper<String> aliasHelper = new DeduplicateHelper<String>(); |
278 |
|
DeduplicateHelper<String> husnrHelper = new DeduplicateHelper<String>(); |
279 |
|
|
280 |
for (Address a : alleAdresser) { |
for (Address a : alleAdresser) { |
281 |
idAddressMap.put(a.id, a); |
idAddressMap.put(a.id, a); |
282 |
|
|
283 |
Map<String,Long> postnrVeje = searchPostnrVejnavnGadeid.get(a.postnr); |
Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(a.postnr); |
284 |
|
|
285 |
if (postnrVeje == null) { |
if (postnrVeje == null) { |
286 |
postnrVeje = new ConcurrentHashMap<String,Long>(); |
postnrVeje = new ConcurrentHashMap<String,Integer>(); |
287 |
searchPostnrVejnavnGadeid.put(a.postnr, postnrVeje); |
searchPostnrVejnavnGadeid.put(a.postnr, postnrVeje); |
288 |
} |
} |
289 |
|
|
290 |
|
|
291 |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
String vasketVejnavn = AddressUtils.vaskVejnavn(a.vejnavn); |
292 |
Long gadeident = postnrVeje.get(vasketVejnavn); |
Integer gadeident = postnrVeje.get(vasketVejnavn); |
293 |
if (gadeident == null) { |
if (gadeident == null) { |
294 |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
//postnrVeje.put(vasketVejnavn, a.gadeid); |
295 |
|
|
296 |
|
gadeident = a.gadeid; |
297 |
|
|
298 |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
Set<String> aliaser = findVejAliaser(a.vejnavn); |
299 |
for(String alias : aliaser) { |
for(String alias : aliaser) { |
300 |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
String vasketAlias = AddressUtils.vaskVejnavn(alias); |
301 |
postnrVeje.put(vasketAlias, a.gadeid); |
vasketAlias = aliasHelper.getInstance(vasketAlias); |
302 |
} |
|
303 |
|
postnrVeje.put(vasketAlias, gadeident); |
304 |
|
} |
305 |
} |
} |
306 |
|
|
307 |
Map<String, Address> gade = searchGadeidentAdresser.get(a.gadeid); |
Map<String, Address> gade = searchGadeidentAdresser.get(gadeident); |
308 |
if (gade == null) { |
if (gade == null) { |
309 |
gade = new HashMap<String, Address>(); |
gade = new HashMap<String, Address>(); |
310 |
searchGadeidentAdresser.put(a.gadeid, gade); |
searchGadeidentAdresser.put(gadeident, gade); |
311 |
} |
} |
312 |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
String husnrSearch = "" + a.husnr + a.husnrbogstav; |
313 |
|
husnrSearch = husnrHelper.getInstance(husnrSearch); |
314 |
gade.put(husnrSearch, a); |
gade.put(husnrSearch, a); |
315 |
} |
} |
316 |
|
|
|
|
|
317 |
//////////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////////// |
318 |
long start2 = System.currentTimeMillis(); |
long start2 = System.currentTimeMillis(); |
319 |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
System.out.println("Build, stage1 elapsed: " + (start2-start1) ); |
320 |
System.out.println("Build -- stage 2 udvidet dækning"); |
System.out.println("Build -- stage 2 alias tabel"); |
321 |
|
|
322 |
List<ExtendedBean> extDao = DatabaseLayer.getExtendedAdresslist(); |
int vaskCount = 0; |
323 |
|
List<AliasBean> aliasList = db.getAliasList(); |
324 |
|
for (AliasBean alias : aliasList) { |
325 |
|
Map<String,Integer> postnrVeje = searchPostnrVejnavnGadeid.get(alias.postnr); |
326 |
|
|
327 |
|
if (postnrVeje == null) { |
328 |
|
//Burde ikke kunne ske - men better safe than sorry |
329 |
|
continue; |
330 |
|
} |
331 |
|
|
332 |
|
String vasketVej = AddressUtils.vaskVejnavn(alias.vejnavn); |
333 |
|
String vasketAlias = AddressUtils.vaskVejnavn(alias.aliasVejnavn); |
334 |
|
|
335 |
|
Integer gadeident = postnrVeje.get(vasketVej); |
336 |
|
if (gadeident == null) { |
337 |
|
//Kender ikke den oprindelige vej |
338 |
|
continue; |
339 |
|
} |
340 |
|
|
341 |
|
Integer aliasIdent = postnrVeje.get(vasketAlias); |
342 |
|
|
343 |
|
if (aliasIdent == null) { //Vi kender ikke denne variant af vejnavnet |
344 |
|
postnrVeje.put(vasketAlias, gadeident); |
345 |
|
vaskCount++; |
346 |
|
} |
347 |
|
|
348 |
|
} |
349 |
|
System.out.println("Anvendte " + vaskCount + " aliaser fra databasen"); |
350 |
|
|
351 |
|
|
352 |
|
//////////////////////////////////////////////////////////////////////////////////////// |
353 |
|
long start3 = System.currentTimeMillis(); |
354 |
|
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
355 |
|
System.out.println("Build -- stage 3 udvidet dækning"); |
356 |
|
|
357 |
|
DeduplicateHelper<String> ruteHelper = new DeduplicateHelper<String>(); |
358 |
|
DeduplicateHelper<String> korelisteHelper = new DeduplicateHelper<String>(); |
359 |
|
|
360 |
|
List<ExtendedBean> extDao = db.getExtendedAdresslist(); |
361 |
for (ExtendedBean eb : extDao) { |
for (ExtendedBean eb : extDao) { |
362 |
|
|
363 |
Address orgAddress = idAddressMap.get(eb.orgId); |
Address orgAddress = idAddressMap.get(eb.orgId); |
364 |
if (orgAddress == null) |
if (orgAddress == null) |
365 |
continue; |
continue; |
366 |
|
|
367 |
|
if (orgAddress.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) { |
368 |
|
//kan være at adressen er blevet markeret dækket og - find-nærmeste data ikke er opdateret i mellemtiden |
369 |
|
continue; |
370 |
|
} |
371 |
|
|
372 |
Address targetAddress = idAddressMap.get(eb.targetId); |
Address targetAddress = idAddressMap.get(eb.targetId); |
373 |
if (targetAddress == null) |
if (targetAddress == null) { |
374 |
continue; |
continue; |
375 |
|
} |
376 |
|
|
377 |
|
|
378 |
if (orgAddress.distributor != null && orgAddress.distributor.equals("LUKKET")) { |
if ( StringUtils.equals(orgAddress.distributor, "LUKKET") ) { |
379 |
continue; |
continue; |
380 |
} |
} |
381 |
|
|
382 |
if (targetAddress.distributor.equals("LUKKET")) { |
|
383 |
|
|
384 |
|
if ( StringUtils.equals(targetAddress.distributor, "LUKKET") ) { |
385 |
continue; |
continue; |
386 |
} |
} |
387 |
|
|
390 |
|
|
391 |
boolean covered = false; |
boolean covered = false; |
392 |
if (targetAddress.distributor.equals("DAO")) { |
if (targetAddress.distributor.equals("DAO")) { |
393 |
orgAddress.rute = calculateExtendedDaoRoute(eb,orgAddress,targetAddress); |
orgAddress.rute = calculateExtendedDaoRoute(eb,orgAddress,targetAddress); |
394 |
|
orgAddress.rute = ruteHelper.getInstance(orgAddress.rute); |
395 |
|
|
396 |
if (orgAddress.rute != null) { |
if (orgAddress.rute != null) { |
397 |
orgAddress.koreliste = targetAddress.koreliste; |
orgAddress.koreliste = targetAddress.koreliste; |
398 |
covered = true; |
covered = true; |
400 |
} |
} |
401 |
|
|
402 |
if (targetAddress.distributor.equals("BK")) { |
if (targetAddress.distributor.equals("BK")) { |
403 |
orgAddress.koreliste = calculateExtendedBkKoreliste(eb,orgAddress,targetAddress); |
orgAddress.koreliste = calculateExtendedBkKoreliste(eb,orgAddress,targetAddress); |
404 |
|
orgAddress.koreliste = korelisteHelper.getInstance(orgAddress.koreliste); |
405 |
|
|
406 |
if (orgAddress.koreliste != null) { |
if (orgAddress.koreliste != null) { |
407 |
orgAddress.rute = targetAddress.rute; |
orgAddress.rute = targetAddress.rute; |
408 |
covered = true; |
covered = true; |
414 |
orgAddress.dbkBane = targetAddress.dbkBane; |
orgAddress.dbkBane = targetAddress.dbkBane; |
415 |
|
|
416 |
/* Sådan gør den gamle service */ |
/* Sådan gør den gamle service */ |
417 |
orgAddress.kommunekode = targetAddress.kommunekode; |
/* 20150520 THN- hvis vi bibeholder de originale kommune+vejkoder kan vi bruge DAVID til join i databasen*/ |
418 |
orgAddress.vejkode = targetAddress.vejkode; |
//orgAddress.kommunekode = targetAddress.kommunekode; |
419 |
|
//orgAddress.vejkode = targetAddress.vejkode; |
420 |
|
|
421 |
|
|
422 |
orgAddress.distributor = targetAddress.distributor; |
orgAddress.distributor = targetAddress.distributor; |
423 |
} |
} |
427 |
idAddressMap = null; |
idAddressMap = null; |
428 |
|
|
429 |
////////////////////////////////////////////////////////////////////////////////////// |
////////////////////////////////////////////////////////////////////////////////////// |
430 |
long start3 = System.currentTimeMillis(); |
long start4 = System.currentTimeMillis(); |
431 |
System.out.println("Build, stage2 elapsed: " + (start3-start2) ); |
System.out.println("Build, stage3 elapsed: " + (start4-start3) ); |
432 |
System.out.println("Build -- stage 3 - 100pct"); |
System.out.println("Build -- stage 4 - 100pct"); |
433 |
|
|
434 |
Map<Integer,HundredePctBean> hundredePct = DatabaseLayer.get100PctList(); |
Map<Short,HundredePctBean> hundredePct = db.get100PctList(); |
435 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
436 |
if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) { |
if (addr.daekningsType != DaekningsType.DAEKNING_IKKEDAEKKET) { |
437 |
continue; |
continue; |
456 |
|
|
457 |
//////////////////////////////////////////////////////////////////////////////////// |
//////////////////////////////////////////////////////////////////////////////////// |
458 |
long stop = System.currentTimeMillis(); |
long stop = System.currentTimeMillis(); |
459 |
System.out.println("Build, stage3 elapsed: " + (stop-start3) ); |
System.out.println("Build, stage4 elapsed: " + (stop-start4) ); |
460 |
System.out.println("Build -- Gathering statistics"); |
System.out.println("Build -- Gathering statistics"); |
461 |
|
|
462 |
for (Address addr : alleAdresser) { |
for (Address addr : alleAdresser) { |
474 |
stats.ikkeDaekketCount++; |
stats.ikkeDaekketCount++; |
475 |
} |
} |
476 |
} |
} |
477 |
|
stats.totalCount = alleAdresser.size(); |
478 |
|
|
479 |
|
|
480 |
stats.elapsed = stop-start1; |
stats.elapsed = stop-start1; |
481 |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
stats.buildTime = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( new Date() ); |
482 |
|
|
483 |
|
System.out.println("Build: totalCount: " + stats.totalCount); |
484 |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
System.out.println("Build: direkteCount: " + stats.direkteCount); |
485 |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
System.out.println("Build: extendedCount: " + stats.extendedCount); |
486 |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
System.out.println("Build: hundredePctCount: " + stats.hundredePctCount); |
495 |
return stats; |
return stats; |
496 |
} |
} |
497 |
|
|
498 |
|
public DatabaseLayer getDatabaseLayer() { |
499 |
|
return db; |
500 |
|
} |
501 |
|
|
502 |
public void clear() { |
public void clear() { |
503 |
searchPostnrVejnavnGadeid.clear(); |
searchPostnrVejnavnGadeid.clear(); |
504 |
searchGadeidentAdresser.clear(); |
searchGadeidentAdresser.clear(); |
507 |
} |
} |
508 |
|
|
509 |
|
|
|
private String getbestLevenshteinDistance(String vasketVejnavn, Map<String,Long> postnrVeje) { |
|
|
for(String vej : postnrVeje.keySet()) { |
|
|
if ( StringUtils.getLevenshteinDistance(vasketVejnavn, vej) == 1) { |
|
|
System.out.println("Levenstein: " + vasketVejnavn + "->" + vej); |
|
|
return vej; |
|
|
} |
|
|
} |
|
|
|
|
|
return null; |
|
|
} |
|
|
|
|
510 |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
private String calculateExtendedDaoRoute(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
511 |
|
if (targetAddress.rute == null) { //hvis targetAdress.rute er null så er adressen ikke dækket alligevel |
512 |
|
return null; |
513 |
|
} |
514 |
|
|
515 |
// /////////////////////////////////////////////////////////////////// |
// /////////////////////////////////////////////////////////////////// |
516 |
switch( eb.transport) { |
switch( eb.transport) { |
521 |
return ".." + targetAddress.rute; |
return ".." + targetAddress.rute; |
522 |
} else if (eb.afstand < 0.701) { |
} else if (eb.afstand < 0.701) { |
523 |
return "..." + targetAddress.rute; |
return "..." + targetAddress.rute; |
524 |
} else if (eb.afstand < 0.501) { |
} else if (eb.afstand < 1.001) { |
525 |
return "...." + targetAddress.rute; |
return "...." + targetAddress.rute; |
526 |
} |
} |
527 |
break; |
break; |
547 |
return "...." + targetAddress.rute; |
return "...." + targetAddress.rute; |
548 |
} |
} |
549 |
break; |
break; |
550 |
|
default: |
551 |
|
System.out.println("Ukendt transport type: " + eb ); |
552 |
} |
} |
553 |
return null; |
return null; |
554 |
} |
} |
564 |
return result; |
return result; |
565 |
} |
} |
566 |
|
|
567 |
|
public List<Address> get100PctAddresses() { |
568 |
|
List<Address> result = new ArrayList<Address>(120000); |
569 |
|
for (Address a : alleAdresser) { |
570 |
|
if ( a.daekningsType == DaekningsType.DAEKNING_100PCT) { |
571 |
|
result.add(a); |
572 |
|
} |
573 |
|
} |
574 |
|
Collections.sort(result ); |
575 |
|
return result; |
576 |
|
} |
577 |
|
|
578 |
/////////////////////////////////////////////////////////// |
/////////////////////////////////////////////////////////// |
579 |
private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
private String calculateExtendedBkKoreliste(ExtendedBean eb, Address orgAddress, Address targetAddress) { |
580 |
String inject; |
String inject; |
590 |
vejnavn = vejnavn.toLowerCase(); |
vejnavn = vejnavn.toLowerCase(); |
591 |
HashSet<String> aliasSet = new HashSet<String>(); |
HashSet<String> aliasSet = new HashSet<String>(); |
592 |
aliasSet.add(vejnavn); |
aliasSet.add(vejnavn); |
593 |
|
|
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
|
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
|
|
|
|
594 |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
aliasSet.add(vejnavn.replace("alle", "allé") ); |
595 |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
aliasSet.add(vejnavn.replace("allé", "alle") ); |
596 |
|
|
597 |
|
|
598 |
|
// forkortelser |
599 |
aliasSet.add(vejnavn.replace("dronningens", "dr") ); |
aliasSet.add(vejnavn.replace("dronningens", "dr") ); |
600 |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr.", "dronningens") ); |
601 |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
aliasSet.add(vejnavn.replace("dr ", "dronningens") ); |
602 |
|
|
603 |
|
aliasSet.add(vejnavn.replace("dronning", "dr") ); |
604 |
|
aliasSet.add(vejnavn.replace("dr.", "dronning") ); |
605 |
|
aliasSet.add(vejnavn.replace("dr ", "dronning") ); |
606 |
|
|
607 |
|
aliasSet.add(vejnavn.replace("kng", "kongen") ); |
608 |
|
aliasSet.add(vejnavn.replace("kongen", "kng") ); |
609 |
|
|
610 |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
aliasSet.add(vejnavn.replace("kvt", "kvarter") ); |
611 |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
aliasSet.add(vejnavn.replace("kvarter", "kvt") ); |
612 |
|
|
613 |
aliasSet.add(vejnavn.replace("gl", "gammel") ); |
aliasSet.add(vejnavn.replace("gl", "gammel") ); |
614 |
aliasSet.add(vejnavn.replace("gammel", "gl") ); |
aliasSet.add(vejnavn.replace("gammel", "gl") ); |
615 |
|
|
616 |
|
aliasSet.add(vejnavn.replace("gl", "gamle") ); |
617 |
|
aliasSet.add(vejnavn.replace("gamle", "gl") ); |
618 |
|
|
619 |
aliasSet.add(vejnavn.replace("lille", "ll") ); |
aliasSet.add(vejnavn.replace("lille", "ll") ); |
620 |
aliasSet.add(vejnavn.replace("ll ", "lille") ); |
aliasSet.add(vejnavn.replace("ll ", "lille") ); |
621 |
aliasSet.add(vejnavn.replace("ll.", "lille") ); |
aliasSet.add(vejnavn.replace("ll.", "lille") ); |
625 |
aliasSet.add(vejnavn.replace("st.", "store") ); |
aliasSet.add(vejnavn.replace("st.", "store") ); |
626 |
|
|
627 |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
aliasSet.add(vejnavn.replace("søndre", "sdr") ); |
628 |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
aliasSet.add(vejnavn.replace("sdr", "søndre") ); |
629 |
|
aliasSet.add(vejnavn.replace("sønder", "sdr") ); |
630 |
|
aliasSet.add(vejnavn.replace("sdr", "sønder") ); |
631 |
|
|
632 |
|
|
633 |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
aliasSet.add(vejnavn.replace("nørre", "nr") ); |
635 |
|
|
636 |
aliasSet.add(vejnavn.replace("nordre", "ndr") ); |
aliasSet.add(vejnavn.replace("nordre", "ndr") ); |
637 |
aliasSet.add(vejnavn.replace("ndr", "nordre") ); |
aliasSet.add(vejnavn.replace("ndr", "nordre") ); |
638 |
|
|
639 |
|
|
640 |
|
aliasSet.add(vejnavn.replace("vestre", "vester") ); |
641 |
|
aliasSet.add(vejnavn.replace("vester", "vestre") ); |
642 |
|
|
643 |
|
aliasSet.add(vejnavn.replace("søndre", "sønder") ); |
644 |
|
aliasSet.add(vejnavn.replace("sønder", "søndre") ); |
645 |
|
|
646 |
|
aliasSet.add(vejnavn.replace("østre", "øster") ); |
647 |
|
aliasSet.add(vejnavn.replace("øster", "østre") ); |
648 |
|
|
649 |
|
aliasSet.add(vejnavn.replace("borgmester", "borgm") ); |
650 |
|
aliasSet.add(vejnavn.replace("borgm", "borgmester") ); |
651 |
|
|
652 |
|
|
653 |
aliasSet.add(vejnavn.replace("sankt", "skt") ); |
aliasSet.add(vejnavn.replace("sankt", "skt") ); |
654 |
aliasSet.add(vejnavn.replace("sankt", "sct") ); |
aliasSet.add(vejnavn.replace("sankt", "sct") ); |
655 |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
aliasSet.add(vejnavn.replace("skt", "sankt") ); |
656 |
|
|
657 |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
aliasSet.add(vejnavn.replace("skt", "sct") ); |
658 |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
aliasSet.add(vejnavn.replace("sct", "skt") ); |
659 |
|
|
660 |
|
|
661 |
|
|
662 |
|
// fornavn forkortelser |
663 |
|
aliasSet.add(vejnavn.replace("john", "j") ); |
664 |
|
aliasSet.add(vejnavn.replace("thomas", "th") ); |
665 |
|
aliasSet.add(vejnavn.replace("thorvald", "th") ); |
666 |
|
aliasSet.add(vejnavn.replace("frederik", "fr") ); |
667 |
|
aliasSet.add(vejnavn.replace("frederiks", "fr") ); |
668 |
|
|
669 |
|
|
670 |
|
aliasSet.add(vejnavn.replace("christian", "chr") ); |
671 |
|
aliasSet.add(vejnavn.replace("christians", "chr") ); |
672 |
|
aliasSet.add(vejnavn.replace("kristian", "kr") ); |
673 |
|
aliasSet.add(vejnavn.replace("kristians", "kr") ); |
674 |
|
|
675 |
|
aliasSet.add(vejnavn.replace("mylius", "myl") ); |
676 |
|
aliasSet.add(vejnavn.replace("myl", "mylius") ); |
677 |
|
|
678 |
|
aliasSet.add(vejnavn.replace("ludvig", "ludv") ); |
679 |
|
aliasSet.add(vejnavn.replace("ludv", "ludvig") ); |
680 |
|
|
681 |
|
|
682 |
|
// alternative stavninger |
683 |
|
aliasSet.add(vejnavn.replace("peder", "peter") ); |
684 |
|
aliasSet.add(vejnavn.replace("peter", "peder") ); |
685 |
|
|
686 |
|
|
687 |
|
|
688 |
|
// Romertal |
689 |
|
aliasSet.add(vejnavn.replace("1", "i") ); |
690 |
|
aliasSet.add(vejnavn.replace("i", "1") ); |
691 |
|
|
692 |
|
aliasSet.add(vejnavn.replace("2", "ii") ); |
693 |
|
aliasSet.add(vejnavn.replace("ii", "2") ); |
694 |
|
|
695 |
|
aliasSet.add(vejnavn.replace("3", "iii") ); |
696 |
|
aliasSet.add(vejnavn.replace("iii", "3") ); |
697 |
|
|
698 |
|
aliasSet.add(vejnavn.replace("4", "iv") ); |
699 |
|
aliasSet.add(vejnavn.replace("iv", "4") ); |
700 |
|
|
701 |
|
aliasSet.add(vejnavn.replace("5", "v") ); |
702 |
|
aliasSet.add(vejnavn.replace("v", "5") ); |
703 |
|
|
704 |
|
aliasSet.add(vejnavn.replace("6", "vi") ); |
705 |
|
aliasSet.add(vejnavn.replace("vi", "6") ); |
706 |
|
|
707 |
|
aliasSet.add(vejnavn.replace("7", "vii") ); |
708 |
|
aliasSet.add(vejnavn.replace("vii", "7") ); |
709 |
|
|
710 |
|
aliasSet.add(vejnavn.replace("8", "viii") ); |
711 |
|
aliasSet.add(vejnavn.replace("viii", "8") ); |
712 |
|
|
713 |
|
aliasSet.add(vejnavn.replace("9", "ix") ); |
714 |
|
aliasSet.add(vejnavn.replace("ix", "9") ); |
715 |
|
|
716 |
|
aliasSet.add(vejnavn.replace("10", "x") ); |
717 |
|
aliasSet.add(vejnavn.replace("x", "10") ); |
718 |
|
|
719 |
|
|
720 |
//alternative måder at stave vej/gade/alle |
//alternative måder at stave vej/gade/alle |
721 |
aliasSet.add(vejnavn.replace("vej", "ve") ); |
aliasSet.add(vejnavn.replace("vej", "ve") ); |
722 |
aliasSet.add(vejnavn.replace("vej", "vj") ); |
aliasSet.add(vejnavn.replace("vej", "vj") ); |
723 |
aliasSet.add(vejnavn.replace("vej", "v") ); |
aliasSet.add(vejnavn.replace("vej", "v") ); |
724 |
|
aliasSet.add(vejnavn.replace("vej", "vejen") ); |
725 |
|
aliasSet.add(vejnavn.replace("vejen", "vej") ); |
726 |
|
|
727 |
|
aliasSet.add(vejnavn.replace("v", "vej") );//Vi kan have vejnavne i DB der bare slutter på v istedet for vej |
728 |
|
|
729 |
aliasSet.add(vejnavn.replace("alle", "all") ); |
aliasSet.add(vejnavn.replace("alle", "all") ); |
730 |
aliasSet.add(vejnavn.replace("allé", "all") ); |
aliasSet.add(vejnavn.replace("allé", "all") ); |
732 |
aliasSet.add(vejnavn.replace("allé", "allú") ); |
aliasSet.add(vejnavn.replace("allé", "allú") ); |
733 |
|
|
734 |
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
aliasSet.add(vejnavn.replace("gade", "gaed") ); //Fundet i logs.hentruteinfo |
735 |
|
aliasSet.add(vejnavn.replace("gade", "gde") ); |
736 |
|
|
737 |
|
aliasSet.add(vejnavn.replace("plads", "pl") ); |
738 |
|
aliasSet.add(vejnavn.replace("vænget", "vænge") ); |
739 |
|
|
740 |
|
aliasSet.add(vejnavn.replace("boulevard", "blvd") ); |
741 |
|
aliasSet.add(vejnavn.replace("blvd", "boulevard") ); |
742 |
|
|
743 |
|
aliasSet.add(vejnavn.replace("boulevard", "boule") ); |
744 |
|
aliasSet.add(vejnavn.replace("boule", "boulevard") ); |
745 |
|
|
746 |
|
aliasSet.add(vejnavn.replace("kronborg", "krbg") ); //Krbg ladegårdsvej, 3000 |
747 |
|
aliasSet.add(vejnavn.replace("krbg", "kronborg") ); |
748 |
|
|
749 |
// Opbyg æøå varianter over alle fundne aliaser |
// Opbyg æøå varianter over alle fundne aliaser |
750 |
|
|
763 |
//danske tegn 2 |
//danske tegn 2 |
764 |
aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") ); |
aliasSet.add( vVejnavn.replace("æ", "ae").replace("ø", "oe") ); |
765 |
aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") ); |
aliasSet.add( vVejnavn.replace("æ", "ae").replace("å", "aa") ); |
766 |
aliasSet.add( vVejnavn.replace("ø", "ae").replace("å", "aa") ); |
aliasSet.add( vVejnavn.replace("ø", "oe").replace("å", "aa") ); |
767 |
aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") ); |
aliasSet.add( vVejnavn.replace("ae", "æ").replace("oe","ø") ); |
768 |
aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") ); |
aliasSet.add( vVejnavn.replace("ae", "æ").replace("aa","å") ); |
769 |
aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); |
aliasSet.add( vVejnavn.replace("oe", "ø").replace("aa", "å") ); |
771 |
//danske tegn 3 |
//danske tegn 3 |
772 |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
aliasSet.add( vejnavn.replace("æ", "ae").replace("ø", "oe").replace("å", "aa") ); |
773 |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
aliasSet.add( vejnavn.replace("ae", "æ").replace("oe", "ø").replace("aa", "å") ); |
774 |
|
|
775 |
|
|
776 |
|
//udenlandsketegn |
777 |
|
aliasSet.add(vejnavn.replace("u", "ü") ); |
778 |
|
aliasSet.add(vejnavn.replace("ü", "u") ); |
779 |
|
|
780 |
|
aliasSet.add(vejnavn.replace("ä", "æ") ); |
781 |
|
aliasSet.add(vejnavn.replace("æ", "ä") ); |
782 |
|
|
783 |
|
aliasSet.add(vejnavn.replace("ö", "ø") ); |
784 |
|
aliasSet.add(vejnavn.replace("ø", "ö") ); |
785 |
} |
} |
786 |
|
|
787 |
return aliasSet; |
return aliasSet; |
788 |
} |
} |
789 |
|
|
790 |
|
public Set<Short> getPostnumre() { |
791 |
|
return new TreeSet<Short>( searchPostnrVejnavnGadeid.keySet() ); |
792 |
|
} |
793 |
|
|
794 |
|
public Set<Entry<String,Integer>> getVejnavne(short postnr) { |
795 |
|
Map<String,Integer> map = searchPostnrVejnavnGadeid.get(postnr); |
796 |
|
|
797 |
|
TreeMap<String,Integer> newMap = new TreeMap<String,Integer>( map );//Lav et nyt TreeMap for at sikre sortering |
798 |
|
|
799 |
|
return newMap.entrySet(); |
800 |
|
} |
801 |
|
|
802 |
|
public Set<String> getHusnumre(int gadeid) { |
803 |
|
|
804 |
|
Map<String, Address> gade = searchGadeidentAdresser.get(gadeid); |
805 |
|
|
806 |
|
Set<String> set = new TreeSet<String>( new NaturalOrderComparator<String>() ); |
807 |
|
set.addAll( gade.keySet() ); |
808 |
|
|
809 |
|
return set; |
810 |
|
} |
811 |
|
|
812 |
|
public Address getAdresse(int gadeid, String husnr) { |
813 |
|
|
814 |
|
Map<String, Address> gade = searchGadeidentAdresser.get(gadeid); |
815 |
|
return gade.get(husnr); |
816 |
|
|
817 |
|
} |
818 |
|
|
819 |
} |
} |