/[projects]/android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java
ViewVC logotype

Diff of /android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 584 by torben, Fri Feb 5 13:57:39 2010 UTC revision 1248 by torben, Thu Mar 31 17:13:19 2011 UTC
# Line 1  Line 1 
1  package dk.thoerup.traininfoservice.banedk;  package dk.thoerup.traininfoservice.banedk;
2    
3  import java.sql.Connection;  
4  import java.sql.ResultSet;  import java.net.URL;
5  import java.sql.Statement;  import java.net.URLEncoder;
 import java.util.ArrayList;  
6  import java.util.Collections;  import java.util.Collections;
 import java.util.List;  
7  import java.util.Map;  import java.util.Map;
8  import java.util.logging.Logger;  import java.util.logging.Logger;
9    
10  import com.gargoylesoftware.htmlunit.WebClient;  import org.jsoup.nodes.Document;
11  import com.gargoylesoftware.htmlunit.html.DomNodeList;  import org.jsoup.nodes.Element;
12  import com.gargoylesoftware.htmlunit.html.HtmlElement;  import org.jsoup.select.Elements;
13  import com.gargoylesoftware.htmlunit.html.HtmlPage;  
14    import dk.thoerup.android.traininfo.common.DepartureBean;
15    import dk.thoerup.android.traininfo.common.DepartureEntry;
16    import dk.thoerup.android.traininfo.common.StationBean.StationEntry;
17  import dk.thoerup.circuitbreaker.CircuitBreaker;  import dk.thoerup.circuitbreaker.CircuitBreaker;
18  import dk.thoerup.circuitbreaker.CircuitBreakerManager;  import dk.thoerup.circuitbreaker.CircuitBreakerManager;
19  import dk.thoerup.traininfoservice.DBConnection;  import dk.thoerup.traininfoservice.StationDAO;
20    import dk.thoerup.traininfoservice.Statistics;
21    
22  public class DepartureFetcher {  public class DepartureFetcher {
23                    
24            enum TrainType{
25                    STOG,
26                    REGIONAL
27            }
28            
29            enum FetchTrainType {
30                    STOG,
31                    REGIONAL,
32                    BOTH
33            }
34            
35          Logger logger = Logger.getLogger(DepartureFetcher.class.getName());          Logger logger = Logger.getLogger(DepartureFetcher.class.getName());
36                    
37          Map<Integer, List<DepartureBean>> cache;          Map<String, DepartureBean> cache;
38            
39            StationDAO stationDao = new StationDAO();
40                    
41          private boolean useTempSite;          private boolean useAzureSite;
42            private int replyTimeout;
43                    
44          public DepartureFetcher(boolean tempSite, int cacheTimeout) {          public DepartureFetcher(boolean azureSite, int cacheTimeout, int replyTimeout) {
45                  useTempSite = tempSite;                  this.replyTimeout = replyTimeout;
46                  cache = new TimeoutMap<Integer,List<DepartureBean>>(cacheTimeout);                  useAzureSite = azureSite;
47                    cache = new TimeoutMap<String,DepartureBean>(cacheTimeout);
48          }          }
49                    
50                    
51                                    
52                    
53          public List<DepartureBean> cachedLookupDepartures(int stationID) throws Exception {          public DepartureBean cachedLookupDepartures(int stationID, boolean arrival, FetchTrainType type) throws Exception {
54                    
55                    final String key = "" + stationID + ":" + arrival + ":" + type.toString();
56                    
57                    DepartureBean departureBean = cache.get(key);
58    
                 List<DepartureBean> list = cache.get(stationID);  
59                                    
60                  if (list == null) {                  if (departureBean == null) {
61                          list = lookupDepartures(stationID);                          departureBean = lookupDepartures(stationID, arrival, type);
62                          cache.put(stationID, list);                          cache.put(key, departureBean);
63                  } else {                  } else {
64                          logger.info("Departure: Cache hit " + stationID); //remove before production                          Statistics.getInstance().incrementDepartureCacheHits();
65                            logger.info("Departure: Cache hit " + key); //remove before production
66                  }                  }
67                  return list;                  return departureBean;
68          }          }
69                                    
70    
71          public List<DepartureBean> lookupDepartures(int stationID) throws Exception {          public DepartureBean lookupDepartures(int stationID, boolean arrival, FetchTrainType type) throws Exception {
                 List<DepartureBean> departureList = new ArrayList<DepartureBean>();  
72                                    
73                  Connection conn = null;                  DepartureBean departureBean = new DepartureBean();
                 try  
                 {  
                         conn = DBConnection.getConnection();  
74                                    
75                          String SQL = "SELECT stationcode_fjrn, stationcode_stog FROM trainstations WHERE id=" + stationID;                  StationEntry station = stationDao.getById(stationID);
76                          Statement stmt = conn.createStatement();                  
77                          ResultSet rs = stmt.executeQuery(SQL);                  departureBean.stationName = station.getName();
78                                            
79                          if (rs.next()) {                  if (station.getRegional() != null && (type == FetchTrainType.REGIONAL||type == FetchTrainType.BOTH) ) {
80                                  String code = rs.getString( 1 );                          DepartureBean tempBean = lookupDepartures(station.getRegional(), TrainType.REGIONAL, arrival);
81                                  if (! rs.wasNull() ) {                          departureBean.entries.addAll( tempBean.entries );
82                                          List<DepartureBean> list = lookupDepartures(code, "FJRN");                          departureBean.notifications.addAll(tempBean.notifications);
                                         departureList.addAll(list);  
                                 }  
                                   
                                 code = rs.getString(2);  
                                 if (! rs.wasNull() ) {  
                                         List<DepartureBean> list = lookupDepartures(code, "S2");  
                                         departureList.addAll(list);      
                                 }  
                                 Collections.sort( departureList );  
                           
                         }  
                           
                 } finally {  
                         if (conn != null && !conn.isClosed() ) {  
                                 conn.close();  
                         }  
83                  }                  }
84                                    
85                  return departureList;                  if (station.getStrain() != null && (type == FetchTrainType.STOG||type == FetchTrainType.BOTH)) {
86                            DepartureBean tempBean = lookupDepartures(station.getStrain(), TrainType.STOG, arrival);
87                            departureBean.entries.addAll( tempBean.entries );
88                            departureBean.notifications.addAll(tempBean.notifications);
89                    }              
90                    
91                    if (departureBean.entries.size() == 0) {
92                            logger.info("No departures found for station " + stationID);
93                    }
94                    
95                    Collections.sort( departureBean.entries );
96    
97                    
98                    return departureBean;
99          }          }
100                    
101          public List<DepartureBean> lookupDepartures(String stationcode, String type) throws Exception {          public DepartureBean lookupDepartures(String stationcode, TrainType type, boolean arrival) throws Exception {
102                  if (useTempSite == false) {                  if (useAzureSite == true) {
103                          return lookupDeparturesNormalSite(stationcode, type);                          return lookupDeparturesAzureSite(stationcode, type, arrival);
104                  } else {                  } else {
105                          return lookupDeparturesFromTemporarySite(stationcode, type);                          return lookupDeparturesWwwSite(stationcode, type, arrival);
106                  }                  }
107          }          }
108                    
109          public List<DepartureBean> lookupDeparturesNormalSite(String stationcode, String type) throws Exception {          private String getTypeStringAzure(TrainType type) {
110                                    switch (type) {
111                  List<DepartureBean> departureList = new ArrayList<DepartureBean>();                  case STOG:
112                            return "S-Tog";
113                    case REGIONAL:
114                            return "Fjerntog";
115                    default:
116                            return ""; //Can not happen
117                    }
118            }
119            
120            private String getTypeStringWww(TrainType type) {
121                    switch (type) {
122                    case STOG:
123                            return "S2";
124                    case REGIONAL:
125                            return "FJRN";
126                    default:
127                            return ""; //Can not happen
128                    }
129            }
130            
131            public DepartureBean lookupDeparturesAzureSite(String stationcode, TrainType type, boolean arrival) throws Exception {
132                                    
133              final WebClient webClient = new WebClient();                  DepartureBean departureBean = new DepartureBean();
134              webClient.setTimeout(2500);                  
135              webClient.setJavaScriptEnabled(false);              
136                                            String typeString = getTypeStringAzure(type);
137              String uri = "http://www.bane.dk/visStation.asp?ArtikelID=4275&W=" + type + "&S=" + stationcode;              String arrivalDeparture = (arrival==false) ? "Afgang" : "Ankomst";
138              BanedkInvocation wrapper = new BanedkInvocation(webClient, uri);              
139                stationcode = URLEncoder.encode(stationcode,"ISO-8859-1");
140    
141                String uri = "http://trafikinfo.bane.dk/Trafikinformation/AfgangAnkomst/" + arrivalDeparture + "/" + stationcode + "/" + typeString + "/UdvidetVisning";        
142                
143                logger.fine("URI: " + uri);    
144                JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
145              CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");              CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
146                            
147              HtmlPage page = (HtmlPage) breaker.invoke(wrapper);              Document page = (Document) breaker.invoke(wrapper);
148                            
149              HtmlElement table = page.getElementById("afgangtabel");              String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
150                Element table = page.getElementById(tableName);
151                            
152              if (table != null) {              if (table != null) {
153                      DomNodeList<HtmlElement> tableRows =  table.getElementsByTagName("tr");                      Elements tableRows =  table.getElementsByTag("tr");
154                        
155                        //boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
156                        //boolean passedTidsstreg = false;
157                                            
158                      for (HtmlElement currentRow : tableRows) {                      for (Element currentRow : tableRows) {
159                          String rowClass = currentRow.getAttribute("class");                          String rowClass = currentRow.attr("class");
160                            /*
161                            if (tidsstregExists == true && passedTidsstreg == false) {
162                                    if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
163                                            passedTidsstreg = true;
164                                    } else {
165                                            continue;
166                                    }
167                            }*/
168                            
169                          if (rowClass != null && rowClass.toLowerCase().contains("station") ) {                          if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
170                                  DomNodeList<HtmlElement> fields = currentRow.getElementsByTagName("td");                                  
171                                    Elements fields = currentRow.getElementsByTag("td");
172                    
173                                  DepartureBean departure = new DepartureBean();                                  DepartureEntry departure = new DepartureEntry();
174                                                                    
175                                  String time = fields.get(0).asText();                                  String time = fields.get(0).text();
176                                  if (time.equals(""))                                  if (time.equals(""))
177                                          time = "0:00"; //Bane.dk bug work-around                                          time = "0:00"; //Bane.dk bug work-around
178                                  departure.setTime(time);                                  departure.setTime(time);
# Line 127  public class DepartureFetcher { Line 180  public class DepartureFetcher {
180                                  int updated = extractUpdated( fields.get(1) );                                  int updated = extractUpdated( fields.get(1) );
181                                  departure.setUpdated(updated);                                  departure.setUpdated(updated);
182                                                                    
183                                  String trainNumber = fields.get(2).asText();                                  String trainNumber = fields.get(2).text();
184                                  if (type.equalsIgnoreCase("S2")) //If it is S-train we need to extract the trainNumber                                  if (type == TrainType.STOG) //If it is S-train we need to extract the trainNumber
185                                          trainNumber = trainNumber + " " + extractTrainNumber(fields.get(2));                                          trainNumber = trainNumber + " " + extractTrainNumberAzure(fields.get(2));
186                                  departure.setTrainNumber(trainNumber);                                  departure.setTrainNumber(trainNumber);
187                                                                    
188                                  String destination = fields.get(3).asText();                                  String destination = fields.get(3).text();
189                                  departure.setDestination(destination);                                  departure.setDestination(destination);
190                                                                    
191                                  String origin = fields.get(4).asText();                                  String origin = fields.get(4).text();
192                                  departure.setOrigin(origin);                                  departure.setOrigin(origin);
193                                                                    
194                                  String location = fields.get(5).asText();                                  String location = fields.get(5).text();
195                                  departure.setLocation(location);                                  departure.setLocation(location);
196                                                                    
197                                  String status = fields.get(6).asText();                                  String status = fields.get(6).text().trim();
198                                  departure.setStatus(status);                                  departure.setStatus(status);
199                                                                    
200                                  String note = extractNote( fields.get(7) );                                  String note = extractNote( fields.get(7) );
201                                  departure.setNote(note);                                  departure.setNote(note);
202                                                                    
203                                  departureList.add(departure);                                  departure.setType(typeString);
204                                    
205                                    departureBean.entries.add( departure );
206                          }                          }
207                      }                      }
208              } else {              } else {
209                  logger.warning("No departures found for station=" + stationcode + ", type=" + type);                  logger.warning("No departures found for station=" + stationcode + ", type=" + type);
210              }              }
211                            
212              return departureList;              Element notifDiv = page.getElementById("station_planlagte_text");
213                if (notifDiv != null) {
214    
215                    Elements tables = notifDiv.getElementsByTag("table");
216                    for (Element tab : tables) {
217    
218                            Elements anchors = tab.getElementsByTag("a");          
219                            if (anchors.size() == 2) {
220                                    departureBean.notifications.add(  anchors.get(1).text() );
221                            }
222                    }
223                    
224                }
225                
226                
227                return departureBean;
228          }          }
229                    
230          public List<DepartureBean> lookupDeparturesFromTemporarySite(String stationcode, String type) throws Exception {          
231            
232            public static String cleanText(String input) {
233                    //apparently JSoup translates &nbsp; characters on www.bane.dk to 0xA0
234                    return input.replace((char) 0xA0, (char)0x20).trim();
235            }
236            
237            public DepartureBean lookupDeparturesWwwSite(String stationcode, TrainType trainType, boolean arrival) throws Exception {
238                                    
239                  List<DepartureBean> departureList = new ArrayList<DepartureBean>();                  DepartureBean departureBean = new DepartureBean();
240                                    
241              final WebClient webClient = new WebClient();                  String type = getTypeStringWww(trainType);
242              webClient.setTimeout(2500);                  
243              webClient.setJavaScriptEnabled(false);                  stationcode = URLEncoder.encode(stationcode, "ISO-8859-1");
244                    
245                                                
246                String uri = "http://www.bane.dk/visStation.asp?ArtikelID=4275&W=" + type + "&S=" + stationcode;
247                logger.fine("URI:" + uri);
248                            
249    
250              String uri = "http://bane.dk/lite/station.asp?w=" + type + "&s=" + stationcode;              JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
               
             BanedkInvocation wrapper = new BanedkInvocation(webClient, uri);  
251              CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");              CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
252                            
253              HtmlPage page = (HtmlPage) breaker.invoke(wrapper);              Element page = (Element) breaker.invoke(wrapper);
254                
255                String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
256                Element table = page.getElementById(tableName);
257                            
258              HtmlElement table = page.getElementById("traf_afgang");  
259                            
260              if (table != null) {                                      if (table != null) {
261                      DomNodeList<HtmlElement> tableRows =  table.getElementsByTagName("tr");                      Elements tableRows =  table.getElementsByTag("tr");
262                                            
263                      boolean isFirst = true;                      //boolean passedTidsstreg = false;
264                        //boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
265                                            
266                      for (HtmlElement currentRow : tableRows) {                      for (Element currentRow : tableRows) {
267                          if (isFirst == true) { //skip table headers                          String rowClass = currentRow.attr("class");
268                                  isFirst = false;                          /*
269                                  continue;                          if (tidsstregExists == true && passedTidsstreg == false) {
270                          }                                  if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
271                                            passedTidsstreg = true;
272                                    } else {
273                                            continue;
274                                    }
275                            }*/
276                                                    
277                          DomNodeList<HtmlElement> fields = currentRow.getElementsByTagName("td");                          
278                            if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
279                          DepartureBean departure = new DepartureBean();                                  Elements fields = currentRow.getElementsByTag("td");
280            
281                          String time = fields.get(0).asText().trim();                                  DepartureEntry departure = new DepartureEntry();
282                                    
                         if (time.equals(""))  
                                 time = "0:00"; //Bane.dk bug work-around  
                         departure.setTime(time);  
   
   
                         String trainNumber = fields.get(1).asText();  
                         departure.setTrainNumber(trainNumber);  
   
                         String destination = fields.get(2).asText();  
                         departure.setDestination(destination);  
   
                         String origin = fields.get(3).asText();  
                         departure.setOrigin(origin);  
   
                         String status = fields.get(4).asText();  
                         departure.setStatus(status);  
   
                         String note = fields.get(5).asText();  
                         departure.setNote(note);  
283    
284                          departureList.add(departure);                                  
285                                    String time = cleanText( fields.get(0).getAllElements().get(2).text() );
286                                    if (time.equals(""))
287                                            time = "0:00"; //Bane.dk bug work-around
288                                    departure.setTime(time);
289                                    
290                                    int updated = extractUpdated( fields.get(1) );
291                                    departure.setUpdated(updated);
292                                    
293                                    String trainNumber = cleanText( fields.get(2).text() );
294                                    if (type.equalsIgnoreCase("S2")) //If it is S-train we need to extract the trainNumber
295                                            trainNumber = trainNumber + " " + extractTrainNumberWww(fields.get(2));
296                                    departure.setTrainNumber(trainNumber);
297                                    
298                                    String destination = cleanText( fields.get(3).text() );
299                                    departure.setDestination(destination);
300                                    
301                                    String origin = cleanText( fields.get(4).text() );
302                                    departure.setOrigin(origin);
303                                    
304                                    String location = cleanText( fields.get(5).text() );
305                                    departure.setLocation(location);
306                                    
307                                    String status = cleanText( fields.get(6).text() );
308                                    departure.setStatus(status);
309                                    
310                                    String note = cleanText( extractNote( fields.get(7) ) );
311                                    departure.setNote(note);
312                                    
313                                    departure.setType(type);
314                                    
315                                    departureBean.entries.add(departure);
316                                    
317                                    
318                            }
319                      }                      }
320              } else {              } else {
321                  logger.warning("No departures found for station=" + stationcode + ", type=" + type);                  logger.warning("No departures found for station=" + stationcode + ", type=" + type);
322              }              }
323                            
324              return departureList;              
325                return departureBean;
326          }          }
327                    
328                    
329          private int extractUpdated(HtmlElement updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"          private int extractUpdated(Element updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"
330                  int updated = -1;                  int updated = -1;
331                                    
332                  DomNodeList<HtmlElement> updatedImgs = updatedTd.getElementsByTagName("img");                  Elements updatedImgs = updatedTd.getElementsByTag("img");
333                  String updatedStr = updatedImgs.get(0).getAttribute("src");                  String updatedStr = updatedImgs.get(0).attr("src");
334                                    
335                  if (updatedStr != null) {                  if (updatedStr != null) {
336                          for (int i=0; i<updatedStr.length(); i++) {                          for (int i=0; i<updatedStr.length(); i++) {
# Line 240  public class DepartureFetcher { Line 344  public class DepartureFetcher {
344                  return updated;                  return updated;
345          }          }
346                    
347          private String extractNote(HtmlElement noteTd) {          private String extractNote(Element noteTd) {
348                  String note = noteTd.asText().trim();                  String note = noteTd.text().trim();
349                    
350                                    
351                  List<HtmlElement> elems = noteTd.getElementsByAttribute("span", "class", "bemtype");                  Elements elems = noteTd.getElementsByClass("bemtype");
352                  if (elems.size() > 0 && note.charAt(note.length()-1) == 'i')                  if (elems.size() > 0 && note.charAt(note.length()-1) == 'i')
353                          note = note.substring(0,note.length() -1 );                          note = note.substring(0,note.length() -1 );
354    
355                  return note;                  return note.trim();
356          }          }
357                    
358          private String extractTrainNumber(HtmlElement trainTd) {          private String extractTrainNumberAzure(Element trainTd) {
359                    Element anchorElement = trainTd.getElementsByTag("a").get(0);
360                    String href = anchorElement.attr("href");
361                    
362                    int pos = href.lastIndexOf('/');
363                    String number = href.substring(pos+1);
364                    
365                    return number;
366            }
367            
368            private String extractTrainNumberWww(Element trainTd) {
369                  String number = "";                  String number = "";
370                  HtmlElement anchorElement = trainTd.getElementsByTagName("a").get(0);                  Element anchorElement = trainTd.getElementsByTag("a").get(0);
371                  String href = anchorElement.getAttribute("href");                  String href = anchorElement.attr("href");
372                  String argstring = href.substring( href.indexOf('?') + 1);                  String argstring = href.substring( href.indexOf('?') + 1);
373                                    
374                  String args[] = argstring.split("&");                  String args[] = argstring.split("&");
# Line 265  public class DepartureFetcher { Line 380  public class DepartureFetcher {
380                  }                  }
381                                    
382                                    
                   
383                  return number;                  return number;
384          }          }
385    
386                    
387          //test          //test
388          /*          /*

Legend:
Removed from v.584  
changed lines
  Added in v.1248

  ViewVC Help
Powered by ViewVC 1.1.20