/[projects]/android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java
ViewVC logotype

Diff of /android/TrainInfoService/src/dk/thoerup/traininfoservice/banedk/DepartureFetcher.java

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 313 by torben, Fri Sep 11 07:13:46 2009 UTC revision 1060 by torben, Thu Sep 16 13:32:10 2010 UTC
# Line 1  Line 1 
1  package dk.thoerup.traininfoservice.banedk;  package dk.thoerup.traininfoservice.banedk;
2    
3  import java.sql.Connection;  
4  import java.sql.ResultSet;  import java.net.URL;
5  import java.sql.Statement;  import java.net.URLEncoder;
 import java.util.ArrayList;  
6  import java.util.Collections;  import java.util.Collections;
7  import java.util.List;  import java.util.Map;
8    import java.util.logging.Logger;
9    
10  import com.gargoylesoftware.htmlunit.ProxyConfig;  import org.jsoup.nodes.Document;
11  import com.gargoylesoftware.htmlunit.WebClient;  import org.jsoup.nodes.Element;
12  import com.gargoylesoftware.htmlunit.html.DomNodeList;  import org.jsoup.select.Elements;
 import com.gargoylesoftware.htmlunit.html.HtmlElement;  
 import com.gargoylesoftware.htmlunit.html.HtmlPage;  
13    
14  import dk.thoerup.traininfoservice.DBConnection;  import dk.thoerup.circuitbreaker.CircuitBreaker;
15    import dk.thoerup.circuitbreaker.CircuitBreakerManager;
16    import dk.thoerup.traininfoservice.StationDAO;
17    import dk.thoerup.traininfoservice.Statistics;
18    import dk.thoerup.traininfoservice.StationBean.StationEntry;
19    
20  public class DepartureFetcher {  public class DepartureFetcher {
21            
22            enum TrainType{
23                    STOG,
24                    REGIONAL
25            }
26            
27            Logger logger = Logger.getLogger(DepartureFetcher.class.getName());
28            
29            Map<String, DepartureBean> cache;
30            
31            StationDAO stationDao = new StationDAO();
32            
33            private boolean useAzureSite;
34            private int replyTimeout;
35            
36            public DepartureFetcher(boolean azureSite, int cacheTimeout, int replyTimeout) {
37                    this.replyTimeout = replyTimeout;
38                    useAzureSite = azureSite;
39                    cache = new TimeoutMap<String,DepartureBean>(cacheTimeout);
40            }
41            
42            
43                    
44            
45            public DepartureBean cachedLookupDepartures(int stationID, boolean arrival) throws Exception {
46                    final String key = "" + stationID + ":" + arrival;
47                                    
48                    DepartureBean departureBean = cache.get(key);
49    
         public List<DepartureBean> lookupDepartures(int stationID) throws Exception {  
                 List<DepartureBean> departureList = new ArrayList<DepartureBean>();  
50                                    
51                  Connection conn = null;                  if (departureBean == null) {
52                  try                          departureBean = lookupDepartures(stationID,arrival);
53                  {                          cache.put(key, departureBean);
54                          conn = DBConnection.getConnection();                  } else {
55                                            Statistics.getInstance().incrementDepartureCacheHits();
56                          String SQL = "SELECT stationcode_fjrn, stationcode_stog FROM trainstations WHERE id=" + stationID;                          logger.info("Departure: Cache hit " + key); //remove before production
                         Statement stmt = conn.createStatement();  
                         ResultSet rs = stmt.executeQuery(SQL);  
                           
                         if (rs.next()) {  
                                 String code = rs.getString( 1 );  
                                 if (! rs.wasNull() ) {  
                                         List<DepartureBean> list = lookupDepartures(code, "FJRN");  
                                         departureList.addAll(list);  
                                 }  
                                   
                                 code = rs.getString(2);  
                                 if (! rs.wasNull() ) {  
                                         List<DepartureBean> list = lookupDepartures(code, "S2");  
                                         departureList.addAll(list);      
                                 }  
                                 Collections.sort( departureList );  
                           
                         }  
                           
                 } finally {  
                         if (conn != null && !conn.isClosed() ) {  
                                 conn.close();  
                         }  
57                  }                  }
58                    return departureBean;
59            }
60                    
61    
62            public DepartureBean lookupDepartures(int stationID, boolean arrival) throws Exception {
63                    
64                    DepartureBean departureBean = new DepartureBean();
65                                    
66                  return departureList;                  StationEntry station = stationDao.getById(stationID);
67                    
68                    departureBean.stationName = station.getName();
69                    
70                    if (station.getRegional() != null) {
71                            DepartureBean tempBean = lookupDepartures(station.getRegional(), TrainType.REGIONAL, arrival);
72                            departureBean.departureEntries.addAll( tempBean.departureEntries );
73                            departureBean.notifications.addAll(tempBean.notifications);
74                    }
75                    
76                    if (station.getStrain() != null) {
77                            DepartureBean tempBean = lookupDepartures(station.getStrain(), TrainType.STOG, arrival);
78                            departureBean.departureEntries.addAll( tempBean.departureEntries );
79                            departureBean.notifications.addAll(tempBean.notifications);
80                    }              
81                    
82                    if (departureBean.departureEntries.size() == 0) {
83                            logger.info("No departures found for station " + stationID);
84                    }
85                    
86                    Collections.sort( departureBean.departureEntries );
87    
88                    
89                    return departureBean;
90          }          }
91                    
92          public List<DepartureBean> lookupDepartures(String stationcode, String type) throws Exception {          public DepartureBean lookupDepartures(String stationcode, TrainType type, boolean arrival) throws Exception {
93                                    if (useAzureSite == true) {
94                  List<DepartureBean> departureList = new ArrayList<DepartureBean>();                          return lookupDeparturesAzureSite(stationcode, type, arrival);
95                    } else {
96                            return lookupDeparturesWwwSite(stationcode, type, arrival);
97                    }
98            }
99            
100            private String getTypeStringAzure(TrainType type) {
101                    switch (type) {
102                    case STOG:
103                            return "S-Tog";
104                    case REGIONAL:
105                            return "Fjerntog";
106                    default:
107                            return ""; //Can not happen
108                    }
109            }
110            
111            private String getTypeStringWww(TrainType type) {
112                    switch (type) {
113                    case STOG:
114                            return "S2";
115                    case REGIONAL:
116                            return "FJRN";
117                    default:
118                            return ""; //Can not happen
119                    }
120            }
121            
122            public DepartureBean lookupDeparturesAzureSite(String stationcode, TrainType type, boolean arrival) throws Exception {
123                                    
124              final WebClient webClient = new WebClient();                  DepartureBean departureBean = new DepartureBean();
125              webClient.setTimeout(1000);                  
126              webClient.setJavaScriptEnabled(false);              
127                                            String typeString = getTypeStringAzure(type);
128                            String arrivalDeparture = (arrival==false) ? "Afgang" : "Ankomst";
129              final HtmlPage page = webClient.getPage("http://www.bane.dk/visStation.asp?ArtikelID=4275&W=" + type + "&S=" + stationcode);              
130                            stationcode = URLEncoder.encode(stationcode,"ISO-8859-1");
131              HtmlElement table = page.getElementById("afgangtabel");  
132              DomNodeList<HtmlElement> tableRows =  table.getElementsByTagName("tr");              String uri = "http://trafikinfo.bane.dk/Trafikinformation/AfgangAnkomst/" + arrivalDeparture + "/" + stationcode + "/" + typeString + "/UdvidetVisning";        
133                            
134              for (HtmlElement currentRow : tableRows) {              logger.fine("URI: " + uri);    
135                  String rowClass = currentRow.getAttribute("class");              JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
136                  if (rowClass != null && rowClass.toLowerCase().contains("station") ) {              CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
137                          DomNodeList<HtmlElement> fields = currentRow.getElementsByTagName("td");              
138                Document page = (Document) breaker.invoke(wrapper);
139                          DepartureBean departure = new DepartureBean();              
140                                        String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
141                          String time = fields.get(0).asText();              Element table = page.getElementById(tableName);
142                          departure.setTime(time);              
143                                        if (table != null) {
144                          int updated = extractUpdated( fields.get(1) );                      Elements tableRows =  table.getElementsByTag("tr");
145                          departure.setUpdated(updated);                      
146                                                boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
147                          String trainNumber = fields.get(2).asText();                      boolean passedTidsstreg = false;
148                          departure.setTrainNumber(trainNumber);                      
149                                                for (Element currentRow : tableRows) {
150                          String destination = fields.get(3).asText();                          String rowClass = currentRow.attr("class");
151                          departure.setDestination(destination);                          
152                                                    if (tidsstregExists == true && passedTidsstreg == false) {
153                          String origin = fields.get(4).asText();                                  if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
154                          departure.setOrigin(origin);                                          passedTidsstreg = true;
155                                                            } else {
156                          String location = fields.get(5).asText();                                          continue;
157                          departure.setLocation(location);                                  }
158                                                    }
159                          String status = fields.get(6).asText();                          
160                          departure.setStatus(status);                          if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
161                                                            
162                          String note = extractNote( fields.get(7) );                                  Elements fields = currentRow.getElementsByTag("td");
163                          departure.setNote(note);          
164                                                            DepartureEntry departure = new DepartureEntry();
165                          departureList.add(departure);                                  
166                                    String time = fields.get(0).text();
167                                    if (time.equals(""))
168                                            time = "0:00"; //Bane.dk bug work-around
169                                    departure.setTime(time);
170                                    
171                                    int updated = extractUpdated( fields.get(1) );
172                                    departure.setUpdated(updated);
173                                    
174                                    String trainNumber = fields.get(2).text();
175                                    if (type == TrainType.STOG) //If it is S-train we need to extract the trainNumber
176                                            trainNumber = trainNumber + " " + extractTrainNumberAzure(fields.get(2));
177                                    departure.setTrainNumber(trainNumber);
178                                    
179                                    String destination = fields.get(3).text();
180                                    departure.setDestination(destination);
181                                    
182                                    String origin = fields.get(4).text();
183                                    departure.setOrigin(origin);
184                                    
185                                    String location = fields.get(5).text();
186                                    departure.setLocation(location);
187                                    
188                                    String status = fields.get(6).text().trim();
189                                    departure.setStatus(status);
190                                    
191                                    String note = extractNote( fields.get(7) );
192                                    departure.setNote(note);
193                                    
194                                    departure.setType(typeString);
195                                    
196                                    departureBean.departureEntries.add( departure );
197                            }
198                        }
199                } else {
200                    logger.warning("No departures found for station=" + stationcode + ", type=" + type);
201                }
202                
203                Element notifDiv = page.getElementById("station_planlagte_text");
204                if (notifDiv != null) {
205    
206                    Elements tables = notifDiv.getElementsByTag("table");
207                    for (Element tab : tables) {
208    
209                            Elements anchors = tab.getElementsByTag("a");          
210                            if (anchors.size() == 2) {
211                                    departureBean.notifications.add(  anchors.get(1).text() );
212                            }
213                  }                  }
214                    
215              }              }
216                            
217              return departureList;              
218                return departureBean;
219            }
220            
221            
222            
223            public static String cleanText(String input) {
224                    //apparently JSoup translates &nbsp; characters on www.bane.dk to 0xA0
225                    return input.replace((char) 0xA0, (char)0x20).trim();
226          }          }
227                    
228          private int extractUpdated(HtmlElement updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"          public DepartureBean lookupDeparturesWwwSite(String stationcode, TrainType trainType, boolean arrival) throws Exception {
229                    
230                    DepartureBean departureBean = new DepartureBean();
231                    
232                    String type = getTypeStringWww(trainType);
233                    
234                    stationcode = URLEncoder.encode(stationcode, "ISO-8859-1");
235                    
236                                                
237                String uri = "http://www.bane.dk/visStation.asp?ArtikelID=4275&W=" + type + "&S=" + stationcode;
238                logger.fine("URI:" + uri);
239                
240    
241                JsoupInvocation wrapper = new JsoupInvocation( new URL(uri), replyTimeout);
242                CircuitBreaker breaker = CircuitBreakerManager.getManager().getCircuitBreaker("banedk");
243                
244                Element page = (Element) breaker.invoke(wrapper);
245                
246                String tableName = arrival == false ? "afgangtabel" : "ankomsttabel";
247                Element table = page.getElementById(tableName);
248                
249    
250                
251                if (table != null) {
252                        Elements tableRows =  table.getElementsByTag("tr");
253                        
254                        boolean passedTidsstreg = false;
255                        boolean tidsstregExists = (table.getElementsByAttributeValue("class", "Tidsstreg").size() > 0);
256                        
257                        for (Element currentRow : tableRows) {
258                            String rowClass = currentRow.attr("class");
259                            
260                            if (tidsstregExists == true && passedTidsstreg == false) {
261                                    if (currentRow.getElementsByAttributeValue("class", "Tidsstreg").size() > 0) {
262                                            passedTidsstreg = true;
263                                    } else {
264                                            continue;
265                                    }
266                            }
267                            
268                            
269                            if (rowClass != null && rowClass.toLowerCase().contains("station") ) {
270                                    Elements fields = currentRow.getElementsByTag("td");
271            
272                                    DepartureEntry departure = new DepartureEntry();
273                                    
274    
275                                    
276                                    String time = cleanText( fields.get(0).getAllElements().get(2).text() );
277                                    if (time.equals(""))
278                                            time = "0:00"; //Bane.dk bug work-around
279                                    departure.setTime(time);
280                                    
281                                    int updated = extractUpdated( fields.get(1) );
282                                    departure.setUpdated(updated);
283                                    
284                                    String trainNumber = cleanText( fields.get(2).text() );
285                                    if (type.equalsIgnoreCase("S2")) //If it is S-train we need to extract the trainNumber
286                                            trainNumber = trainNumber + " " + extractTrainNumberWww(fields.get(2));
287                                    departure.setTrainNumber(trainNumber);
288                                    
289                                    String destination = cleanText( fields.get(3).text() );
290                                    departure.setDestination(destination);
291                                    
292                                    String origin = cleanText( fields.get(4).text() );
293                                    departure.setOrigin(origin);
294                                    
295                                    String location = cleanText( fields.get(5).text() );
296                                    departure.setLocation(location);
297                                    
298                                    String status = cleanText( fields.get(6).text() );
299                                    departure.setStatus(status);
300                                    
301                                    String note = cleanText( extractNote( fields.get(7) ) );
302                                    departure.setNote(note);
303                                    
304                                    departure.setType(type);
305                                    
306                                    departureBean.departureEntries.add(departure);
307                                    
308                                    
309                            }
310                        }
311                } else {
312                    logger.warning("No departures found for station=" + stationcode + ", type=" + type);
313                }
314                
315                
316                return departureBean;
317            }
318                    
319            
320            private int extractUpdated(Element updatedTd) { //extract the digit (in this case: 4) from "media/trafikinfo/opdater4.gif"
321                  int updated = -1;                  int updated = -1;
322                                    
323                  DomNodeList<HtmlElement> updatedImgs = updatedTd.getElementsByTagName("img");                  Elements updatedImgs = updatedTd.getElementsByTag("img");
324                  String updatedStr = updatedImgs.get(0).getAttribute("src");                  String updatedStr = updatedImgs.get(0).attr("src");
325                                    
326                  if (updatedStr != null) {                  if (updatedStr != null) {
327                          for (int i=0; i<updatedStr.length(); i++) {                          for (int i=0; i<updatedStr.length(); i++) {
# Line 125  public class DepartureFetcher { Line 335  public class DepartureFetcher {
335                  return updated;                  return updated;
336          }          }
337                    
338          private String extractNote(HtmlElement noteTd) {          private String extractNote(Element noteTd) {
339                  String note = noteTd.asText().trim();                  String note = noteTd.text().trim();
340                                    
341                  List<HtmlElement> elems = noteTd.getElementsByAttribute("span", "class", "bemtype");                  
342                    Elements elems = noteTd.getElementsByClass("bemtype");
343                  if (elems.size() > 0 && note.charAt(note.length()-1) == 'i')                  if (elems.size() > 0 && note.charAt(note.length()-1) == 'i')
344                          note = note.substring(0,note.length() -1 );                          note = note.substring(0,note.length() -1 );
345    
346                  return note;                  return note.trim();
347          }          }
348                    
349            private String extractTrainNumberAzure(Element trainTd) {
350                    Element anchorElement = trainTd.getElementsByTag("a").get(0);
351                    String href = anchorElement.attr("href");
352                    
353                    int pos = href.lastIndexOf('/');
354                    String number = href.substring(pos+1);
355                    
356                    return number;
357            }
358            
359            private String extractTrainNumberWww(Element trainTd) {
360                    String number = "";
361                    Element anchorElement = trainTd.getElementsByTag("a").get(0);
362                    String href = anchorElement.attr("href");
363                    String argstring = href.substring( href.indexOf('?') + 1);
364                    
365                    String args[] = argstring.split("&");
366                    for (String arg : args) {
367                            String pair[] = arg.split("="); // Key=pair[0], Value=pair[1]
368                            
369                            if (pair[0].equalsIgnoreCase("TogNr"))
370                                    number = pair[1];
371                    }
372                    
373                    
374                    return number;
375            }
376    
377            
378          //test          //test
379          public static void main(String args[]) throws Exception{          /*
380            public static void main(String args[]) throws Exception {
381                  DepartureFetcher f = new DepartureFetcher();                  DepartureFetcher f = new DepartureFetcher();
382                  List<DepartureBean> deps = f.lookupDepartures("AR", "FJRN");                  List<DepartureBean> deps = f.lookupDepartures("AR", "FJRN");
383                  for(DepartureBean d : deps) {                  for(DepartureBean d : deps) {
# Line 145  public class DepartureFetcher { Line 386  public class DepartureFetcher {
386                  }                  }
387                                    
388                  System.out.println("--------------------------");                  System.out.println("--------------------------");
389          }          }*/
390  }  }

Legend:
Removed from v.313  
changed lines
  Added in v.1060

  ViewVC Help
Powered by ViewVC 1.1.20