/[projects]/android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java
ViewVC logotype

Diff of /android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 305 by torben, Thu Sep 10 09:40:27 2009 UTC revision 1061 by torben, Thu Sep 16 14:04:28 2010 UTC
# Line 1  Line 1 
1  package dk.thoerup.traininfoservice.banedk;  package dk.thoerup.traininfoservice.banedk;
2    
 import java.util.ArrayList;  
 import java.util.List;  
3    
4  import com.gargoylesoftware.htmlunit.ProxyConfig;  import java.net.URL;
5  import com.gargoylesoftware.htmlunit.WebClient;  import java.net.URLEncoder;
6  import com.gargoylesoftware.htmlunit.html.DomNodeList;  import java.util.Collections;
7  import com.gargoylesoftware.htmlunit.html.HtmlElement;  import java.util.Map;
8  import com.gargoylesoftware.htmlunit.html.HtmlPage;  import java.util.logging.Logger;
9    
10    import org.jsoup.nodes.Document;
11    import org.jsoup.nodes.Element;
12    import org.jsoup.select.Elements;
13    
14    import dk.thoerup.android.traininfo.common.DepartureBean;
15    import dk.thoerup.android.traininfo.common.DepartureEntry;
16    import dk.thoerup.android.traininfo.common.StationBean.StationEntry;
17    import dk.thoerup.circuitbreaker.CircuitBreaker;
18    import dk.thoerup.circuitbreaker.CircuitBreakerManager;
19    import dk.thoerup.traininfoservice.StationDAO;
20    import dk.thoerup.traininfoservice.Statistics;
21    
22  public class DepartureFetcher {  public class DepartureFetcher {
23                    
24            enum TrainType{
25                    STOG,
26                    REGIONAL
27            }
28            
29            Logger logger = Logger.getLogger(DepartureFetcher.class.getName());
30            
31            Map<String, DepartureBean> cache;
32            
33            StationDAO stationDao = new StationDAO();
34            
35            private boolean useAzureSite;
36            private int replyTimeout;
37            
38            public DepartureFetcher(boolean azureSite, int cacheTimeout, int replyTimeout) {
39                    this.replyTimeout = replyTimeout;
40                    useAzureSite = azureSite;
41                    cache = new TimeoutMap<String,DepartureBean>(cacheTimeout);
42            }
43            
44            
45                    
46            
47            public DepartureBean cachedLookupDepartures(int stationID, boolean arrival) throws Exception {
48                    final String key = "" + stationID + ":" + arrival;
49                    
50                    DepartureBean departureBean = cache.get(key);
51    
52                    
53                    if (departureBean == null) {
54                            departureBean = lookupDepartures(stationID,arrival);
55                            cache.put(key, departureBean);
56                    } else {
57                            Statistics.getInstance().incrementDepartureCacheHits();
58                            logger.info("Departure: Cache hit " + key); //remove before production
59                    }
60                    return departureBean;
61            }
62                    
63    
64            public DepartureBean lookupDepartures(int stationID, boolean arrival) throws Exception {
65                    
66                    DepartureBean departureBean = new DepartureBean();
67                    
68                    StationEntry station = stationDao.getById(stationID);
69                    
70                    departureBean.stationName = station.getName();
71                    
72                    if (station.getRegional() != null) {
73                            DepartureBean tempBean = lookupDepartures(station.getRegional(), TrainType.REGIONAL, arrival);
74                            departureBean.departureEntries.addAll( tempBean.departureEntries );
75                            departureBean.notifications.addAll(tempBean.notifications);
76                    }
77                    
78                    if (station.getStrain() != null) {
79                            DepartureBean tempBean = lookupDepartures(station.getStrain(), TrainType.STOG, arrival);
80                            departureBean.departureEntries.addAll( tempBean.departureEntries );
81                            departureBean.notifications.addAll(tempBean.notifications);
82                    }              
83                    
84                    if (departureBean.departureEntries.size() == 0) {
85                            logger.info("No departures found for station " + stationID);
86                    }
87                    
88                    Collections.sort( departureBean.departureEntries );
89    
90                    
91                    return departureBean;
92            }
93            
94            public DepartureBean lookupDepartures(String stationcode, TrainType type, boolean arrival) throws Exception {
95                    if (useAzureSite == true) {
96                            return lookupDeparturesAzureSite(stationcode, type, arrival);
97                    } else {
98                            return lookupDeparturesWwwSite(stationcode, type, arrival);
99                    }
100            }
101            
102            private String getTypeStringAzure(TrainType type) {
103                    switch (type) {
104                    case STOG:
105                            return "S-Tog";
106                    case REGIONAL:
107                            return "Fjerntog";
108                    default:
109                            return ""; //Can not happen
110                    }
111            }
112            
113            private String getTypeStringWww(TrainType type) {
114                    switch (type) {
115                    case STOG:
116                            return "S2";
117                    case REGIONAL:
118                            return "FJRN";
119                    default:
120                            return ""; //Can not happen
121                    }
122            }
123            
124            public DepartureBean lookupDeparturesAzureSite(String stationcode, TrainType type, boolean arrival) throws Exception {
125                    
126                    DepartureBean departureBean = new DepartureBean();
127                    
128                
129                String typeString = getTypeStringAzure(type);
130                String arrivalDeparture = (arrival==false) ? "Afgang" : "Ankomst";
131                
132                stationcode = URLEncoder.encode(stationcode,"ISO-8859-1");
133    
134                String uri = "http://trafikinfo.bane.dk/Trafikinformation/AfgangAnkomst/" + arrivalDeparture + "/" + stationcode + "/" + typeString + "/UdvidetVisning";        
135                
136                logger.fine("URI: " + uri);    
137                JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
138                CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
139                
140                Document page = (Document) breaker.invoke(wrapper);
141                
142                String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
143                Element table = page.getElementById(tableName);
144                
145                if (table != null) {
146                        Elements tableRows =  table.getElementsByTag("tr");
147                        
148                        boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
149                        boolean passedTidsstreg = false;
150                        
151                        for (Element currentRow : tableRows) {
152                            String rowClass = currentRow.attr("class");
153                            
154                            if (tidsstregExists == true && passedTidsstreg == false) {
155                                    if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
156                                            passedTidsstreg = true;
157                                    } else {
158                                            continue;
159                                    }
160                            }
161                            
162                            if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
163                                    
164                                    Elements fields = currentRow.getElementsByTag("td");
165                    
166          static ProxyConfig proxyConfig;                                  DepartureEntry departure = new DepartureEntry();
167          static {                                  
168                  proxyConfig = new ProxyConfig();                                  String time = fields.get(0).text();
169                  proxyConfig.setProxyHost("rafiki.t-hoerup.dk");                                  if (time.equals(""))
170                  proxyConfig.setProxyPort(3128);                                          time = "0:00"; //Bane.dk bug work-around
171          }                                  departure.setTime(time);
172                                            
173          public List<DepartureBean> lookupDepartures() throws Exception {                                  int updated = extractUpdated( fields.get(1) );
174                                                    departure.setUpdated(updated);
175                  List<DepartureBean> departureList = new ArrayList<DepartureBean>();                                  
176                                                    String trainNumber = fields.get(2).text();
177              final WebClient webClient = new WebClient();                                  if (type == TrainType.STOG) //If it is S-train we need to extract the trainNumber
178              webClient.setTimeout(1000);                                          trainNumber = trainNumber + " " + extractTrainNumberAzure(fields.get(2));
179              webClient.setProxyConfig(proxyConfig);                                  departure.setTrainNumber(trainNumber);
180              webClient.setJavaScriptEnabled(false);                                  
181                                                String destination = fields.get(3).text();
182              final HtmlPage page = webClient.getPage("http://www.bane.dk/visStation.asp?ArtikelID=4275&W=FJRN&S=BJ");                                  departure.setDestination(destination);
183                                                
184              HtmlElement table = page.getElementById("afgangtabel");                                  String origin = fields.get(4).text();
185              DomNodeList<HtmlElement> tableRows =  table.getElementsByTagName("tr");                                  departure.setOrigin(origin);
186                                                
187              for (HtmlElement currentRow : tableRows) {                                  String location = fields.get(5).text();
188                  String rowClass = currentRow.getAttribute("class");                                  departure.setLocation(location);
189                  if (rowClass != null && rowClass.toLowerCase().contains("station") ) {                                  
190                          DomNodeList<HtmlElement> fields = currentRow.getElementsByTagName("td");                                  String status = fields.get(6).text().trim();
191                                    departure.setStatus(status);
192                          DepartureBean departure = new DepartureBean();                                  
193                                                            String note = extractNote( fields.get(7) );
194                          String time = fields.get(0).asText();                                  departure.setNote(note);
195                          departure.setTime(time);                                  
196                                                            departure.setType(typeString);
197                          int updated = extractUpdated( fields.get(1) );                                  
198                          departure.setUpdated(updated);                                  departureBean.departureEntries.add( departure );
199                                                    }
200                          String trainNumber = fields.get(2).asText();                      }
201                          departure.setTrainNumber(trainNumber);              } else {
202                                            logger.warning("No departures found for station=" + stationcode + ", type=" + type);
203                          String destination = fields.get(3).asText();              }
204                          departure.setDestination(destination);              
205                                        Element notifDiv = page.getElementById("station_planlagte_text");
206                          String origin = fields.get(4).asText();              if (notifDiv != null) {
207                          departure.setOrigin(origin);  
208                                            Elements tables = notifDiv.getElementsByTag("table");
209                          String location = fields.get(5).asText();                  for (Element tab : tables) {
210                          departure.setLocation(location);  
211                                                    Elements anchors = tab.getElementsByTag("a");          
212                          String status = fields.get(6).asText();                          if (anchors.size() == 2) {
213                          departure.setStatus(status);                                  departureBean.notifications.add(  anchors.get(1).text() );
214                                                    }
                         String note = fields.get(7).asText();  
                         departure.setNote(note);  
                           
                         departureList.add(departure);  
215                  }                  }
216                    
217                }
218                
219                
220                return departureBean;
221            }
222            
223            
224            
225            public static String cleanText(String input) {
226                    //apparently JSoup translates &nbsp; characters on www.bane.dk to 0xA0
227                    return input.replace((char) 0xA0, (char)0x20).trim();
228            }
229            
230            public DepartureBean lookupDeparturesWwwSite(String stationcode, TrainType trainType, boolean arrival) throws Exception {
231                    
232                    DepartureBean departureBean = new DepartureBean();
233                    
234                    String type = getTypeStringWww(trainType);
235                    
236                    stationcode = URLEncoder.encode(stationcode, "ISO-8859-1");
237                    
238                                                
239                String uri = "http://www.bane.dk/visStation.asp?ArtikelID=4275&W=" + type + "&S=" + stationcode;
240                logger.fine("URI:" + uri);
241                
242    
243                JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
244                CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
245                
246                Element page = (Element) breaker.invoke(wrapper);
247                
248                String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
249                Element table = page.getElementById(tableName);
250                
251    
252                
253                if (table != null) {
254                        Elements tableRows =  table.getElementsByTag("tr");
255                        
256                        boolean passedTidsstreg = false;
257                        boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
258                        
259                        for (Element currentRow : tableRows) {
260                            String rowClass = currentRow.attr("class");
261                            
262                            if (tidsstregExists == true && passedTidsstreg == false) {
263                                    if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
264                                            passedTidsstreg = true;
265                                    } else {
266                                            continue;
267                                    }
268                            }
269                            
270                            
271                            if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
272                                    Elements fields = currentRow.getElementsByTag("td");
273            
274                                    DepartureEntry departure = new DepartureEntry();
275                                    
276    
277                                    
278                                    String time = cleanText( fields.get(0).getAllElements().get(2).text() );
279                                    if (time.equals(""))
280                                            time = "0:00"; //Bane.dk bug work-around
281                                    departure.setTime(time);
282                                    
283                                    int updated = extractUpdated( fields.get(1) );
284                                    departure.setUpdated(updated);
285                                    
286                                    String trainNumber = cleanText( fields.get(2).text() );
287                                    if (type.equalsIgnoreCase("S2")) //If it is S-train we need to extract the trainNumber
288                                            trainNumber = trainNumber + " " + extractTrainNumberWww(fields.get(2));
289                                    departure.setTrainNumber(trainNumber);
290                                    
291                                    String destination = cleanText( fields.get(3).text() );
292                                    departure.setDestination(destination);
293                                    
294                                    String origin = cleanText( fields.get(4).text() );
295                                    departure.setOrigin(origin);
296                                    
297                                    String location = cleanText( fields.get(5).text() );
298                                    departure.setLocation(location);
299                                    
300                                    String status = cleanText( fields.get(6).text() );
301                                    departure.setStatus(status);
302                                    
303                                    String note = cleanText( extractNote( fields.get(7) ) );
304                                    departure.setNote(note);
305                                    
306                                    departure.setType(type);
307                                    
308                                    departureBean.departureEntries.add(departure);
309                                    
310                                    
311                            }
312                        }
313                } else {
314                    logger.warning("No departures found for station=" + stationcode + ", type=" + type);
315              }              }
316                            
317              return departureList;              
318                return departureBean;
319          }          }
320                    
321                    
322          private int extractUpdated(HtmlElement updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"          private int extractUpdated(Element updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"
323                  int updated = -1;                  int updated = -1;
324                                    
325                  DomNodeList<HtmlElement> updatedImgs = updatedTd.getElementsByTagName("img");                  Elements updatedImgs = updatedTd.getElementsByTag("img");
326                  String updatedStr = updatedImgs.get(0).getAttribute("src");                  String updatedStr = updatedImgs.get(0).attr("src");
327                                    
328                  if (updatedStr != null) {                  if (updatedStr != null) {
329                          for (int i=0; i<updatedStr.length(); i++) {                          for (int i=0; i<updatedStr.length(); i++) {
# Line 89  public class DepartureFetcher { Line 337  public class DepartureFetcher {
337                  return updated;                  return updated;
338          }          }
339                    
340            private String extractNote(Element noteTd) {
341                    String note = noteTd.text().trim();
342                    
343                    
344                    Elements elems = noteTd.getElementsByClass("bemtype");
345                    if (elems.size() > 0 && note.charAt(note.length()-1) == 'i')
346                            note = note.substring(0,note.length() -1 );
347    
348                    return note.trim();
349            }
350            
351            private String extractTrainNumberAzure(Element trainTd) {
352                    Element anchorElement = trainTd.getElementsByTag("a").get(0);
353                    String href = anchorElement.attr("href");
354                    
355                    int pos = href.lastIndexOf('/');
356                    String number = href.substring(pos+1);
357                    
358                    return number;
359            }
360            
361            private String extractTrainNumberWww(Element trainTd) {
362                    String number = "";
363                    Element anchorElement = trainTd.getElementsByTag("a").get(0);
364                    String href = anchorElement.attr("href");
365                    String argstring = href.substring( href.indexOf('?') + 1);
366                    
367                    String args[] = argstring.split("&");
368                    for (String arg : args) {
369                            String pair[] = arg.split("="); // Key=pair[0], Value=pair[1]
370                            
371                            if (pair[0].equalsIgnoreCase("TogNr"))
372                                    number = pair[1];
373                    }
374                    
375                    
376                    return number;
377            }
378    
379            
380          //test          //test
381          public static void main(String args[]) throws Exception{          /*
382            public static void main(String args[]) throws Exception {
383                  DepartureFetcher f = new DepartureFetcher();                  DepartureFetcher f = new DepartureFetcher();
384                  List<DepartureBean> deps = f.lookupDepartures();                  List<DepartureBean> deps = f.lookupDepartures("AR", "FJRN");
385                  for(DepartureBean d : deps) {                  for(DepartureBean d : deps) {
386                          System.out.println( d.getTime() + ";" + d.getUpdated() + ";" + d.getTrainNumber() + ";" +                          System.out.println( d.getTime() + ";" + d.getUpdated() + ";" + d.getTrainNumber() + ";" +
387                                                  d.getDestination() + ";" + d.getOrigin() + ";" + d.getLocation() + ";" + d.getStatus() + ";" + d.getNote()   );                                                  d.getDestination() + ";" + d.getOrigin() + ";" + d.getLocation() + ";" + d.getStatus() + ";" + d.getNote()   );
388                  }                  }
389                                    
390                  System.out.println("--------------------------");                  System.out.println("--------------------------");
391          }          }*/
392  }  }

Legend:
Removed from v.305  
changed lines
  Added in v.1061

  ViewVC Help
Powered by ViewVC 1.1.20