11126fa4f23badf4f50d366605a6d5ef910f7f83
[project/netifd.git] / system-linux.c
1 #define _GNU_SOURCE
2
3 #include <sys/socket.h>
4 #include <sys/ioctl.h>
5 #include <sys/stat.h>
6 #include <sys/syscall.h>
7
8 #include <linux/rtnetlink.h>
9 #include <linux/sockios.h>
10 #include <linux/if_vlan.h>
11 #include <linux/if_bridge.h>
12
13 #include <unistd.h>
14 #include <string.h>
15 #include <fcntl.h>
16 #include <glob.h>
17
18 #include <netlink/msg.h>
19 #include <netlink/attr.h>
20 #include <netlink/socket.h>
21 #include <libubox/uloop.h>
22
23 #include "netifd.h"
24 #include "device.h"
25 #include "system.h"
26
27 struct event_socket {
28         struct uloop_fd uloop;
29         struct nl_sock *sock;
30         struct nl_cb *cb;
31 };
32
33 static int sock_ioctl = -1;
34 static struct nl_sock *sock_rtnl = NULL;
35
36 static int cb_rtnl_event(struct nl_msg *msg, void *arg);
37
38 static void
39 handler_nl_event(struct uloop_fd *u, unsigned int events)
40 {
41         struct event_socket *ev = container_of(u, struct event_socket, uloop);
42         nl_recvmsgs(ev->sock, ev->cb);
43 }
44
45 static bool
46 create_event_socket(struct event_socket *ev, int protocol,
47                     int (*cb)(struct nl_msg *msg, void *arg))
48 {
49         // Prepare socket for link events
50         ev->cb = nl_cb_alloc(NL_CB_DEFAULT);
51         if (!ev->cb)
52                 return false;
53
54         nl_cb_set(ev->cb, NL_CB_VALID, NL_CB_CUSTOM, cb, NULL);
55
56         ev->sock = nl_socket_alloc();
57         if (!ev->sock)
58                 return false;
59
60         if (nl_connect(ev->sock, protocol))
61                 return false;
62
63         ev->uloop.fd = nl_socket_get_fd(ev->sock);
64         ev->uloop.cb = handler_nl_event;
65         uloop_fd_add(&ev->uloop, ULOOP_READ | ULOOP_EDGE_TRIGGER);
66         return true;
67 }
68
69 int system_init(void)
70 {
71         static struct event_socket rtnl_event;
72
73         sock_ioctl = socket(AF_LOCAL, SOCK_DGRAM, 0);
74         fcntl(sock_ioctl, F_SETFD, fcntl(sock_ioctl, F_GETFD) | FD_CLOEXEC);
75
76         // Prepare socket for routing / address control
77         sock_rtnl = nl_socket_alloc();
78         if (!sock_rtnl)
79                 return -1;
80
81         if (nl_connect(sock_rtnl, NETLINK_ROUTE))
82                 return -1;
83
84         if (!create_event_socket(&rtnl_event, NETLINK_ROUTE, cb_rtnl_event))
85                 return -1;
86
87         // Receive network link events form kernel
88         nl_socket_add_membership(rtnl_event.sock, RTNLGRP_LINK);
89
90
91         return 0;
92 }
93
94 static void system_set_sysctl(const char *path, const char *val)
95 {
96         int fd;
97
98         fd = open(path, O_WRONLY);
99         if (fd < 0)
100                 return;
101
102         write(fd, val, strlen(val));
103         close(fd);
104 }
105
106 static void system_set_dev_sysctl(const char *path, const char *device, const char *val)
107 {
108         static char buf[256];
109
110         snprintf(buf, sizeof(buf), path, val);
111         system_set_sysctl(buf, val);
112 }
113
114 static void system_set_disable_ipv6(struct device *dev, const char *val)
115 {
116         system_set_dev_sysctl("/proc/sys/net/ipv6/conf/%s/disable_ipv6", dev->ifname, val);
117 }
118
119 // Evaluate netlink messages
120 static int cb_rtnl_event(struct nl_msg *msg, void *arg)
121 {
122         struct nlmsghdr *nh = nlmsg_hdr(msg);
123         struct ifinfomsg *ifi = NLMSG_DATA(nh);
124         struct nlattr *nla[__IFLA_MAX];
125
126         if (nh->nlmsg_type != RTM_DELLINK && nh->nlmsg_type != RTM_NEWLINK)
127                 goto out;
128
129         nlmsg_parse(nh, sizeof(*ifi), nla, __IFLA_MAX - 1, NULL);
130         if (!nla[IFLA_IFNAME])
131                 goto out;
132
133         struct device *dev = device_get(RTA_DATA(nla[IFLA_IFNAME]), false);
134         if (!dev)
135                 goto out;
136
137         dev->ifindex = ifi->ifi_index;
138         device_set_present(dev, (nh->nlmsg_type == RTM_NEWLINK));
139
140 out:
141         return 0;
142 }
143
144 static int system_rtnl_call(struct nl_msg *msg)
145 {
146         int s = -(nl_send_auto_complete(sock_rtnl, msg)
147                         || nl_wait_for_ack(sock_rtnl));
148         nlmsg_free(msg);
149         return s;
150 }
151
152 int system_bridge_delbr(struct device *bridge)
153 {
154         return ioctl(sock_ioctl, SIOCBRDELBR, bridge->ifname);
155 }
156
157 static int system_bridge_if(const char *bridge, struct device *dev, int cmd, void *data)
158 {
159         struct ifreq ifr;
160         if (dev)
161                 ifr.ifr_ifindex = dev->ifindex;
162         else
163                 ifr.ifr_data = data;
164         strncpy(ifr.ifr_name, bridge, sizeof(ifr.ifr_name));
165         return ioctl(sock_ioctl, cmd, &ifr);
166 }
167
168 int system_bridge_addif(struct device *bridge, struct device *dev)
169 {
170         system_set_disable_ipv6(dev, "1");
171         return system_bridge_if(bridge->ifname, dev, SIOCBRADDIF, NULL);
172 }
173
174 int system_bridge_delif(struct device *bridge, struct device *dev)
175 {
176         system_set_disable_ipv6(dev, "0");
177         return system_bridge_if(bridge->ifname, dev, SIOCBRDELIF, NULL);
178 }
179
180 static bool system_is_bridge(const char *name, char *buf, int buflen)
181 {
182         struct stat st;
183
184         snprintf(buf, buflen, "/sys/devices/virtual/net/%s/bridge", name);
185         if (stat(buf, &st) < 0)
186                 return false;
187
188         return true;
189 }
190
191 static char *system_get_bridge(const char *name, char *buf, int buflen)
192 {
193         char *path;
194         ssize_t len;
195         glob_t gl;
196
197         snprintf(buf, buflen, "/sys/devices/virtual/net/*/brif/%s/bridge", name);
198         if (glob(buf, GLOB_NOSORT, NULL, &gl) < 0)
199                 return NULL;
200
201         if (gl.gl_pathc == 0)
202                 return NULL;
203
204         len = readlink(gl.gl_pathv[0], buf, buflen);
205         if (len < 0)
206                 return NULL;
207
208         buf[len] = 0;
209         path = strrchr(buf, '/');
210         if (!path)
211                 return NULL;
212
213         return path + 1;
214 }
215
216 static int system_if_resolve(struct device *dev)
217 {
218         struct ifreq ifr;
219         strncpy(ifr.ifr_name, dev->ifname, sizeof(ifr.ifr_name));
220         if (!ioctl(sock_ioctl, SIOCGIFINDEX, &ifr))
221                 return ifr.ifr_ifindex;
222         else
223                 return 0;
224 }
225
226 static int system_if_flags(const char *ifname, unsigned add, unsigned rem)
227 {
228         struct ifreq ifr;
229         strncpy(ifr.ifr_name, ifname, sizeof(ifr.ifr_name));
230         ioctl(sock_ioctl, SIOCGIFFLAGS, &ifr);
231         ifr.ifr_flags |= add;
232         ifr.ifr_flags &= ~rem;
233         return ioctl(sock_ioctl, SIOCSIFFLAGS, &ifr);
234 }
235
236 struct clear_data {
237         struct nl_msg *msg;
238         struct device *dev;
239         int type;
240         int size;
241         int af;
242 };
243
244
245 static bool check_ifaddr(struct nlmsghdr *hdr, int ifindex)
246 {
247         struct ifaddrmsg *ifa = NLMSG_DATA(hdr);
248
249         return ifa->ifa_index == ifindex;
250 }
251
252 static bool check_route(struct nlmsghdr *hdr, int ifindex)
253 {
254         struct nlattr *tb[__RTA_MAX];
255
256         nlmsg_parse(hdr, sizeof(struct rtmsg), tb, __RTA_MAX - 1, NULL);
257         if (!tb[RTA_OIF])
258                 return false;
259
260         return *(int *)RTA_DATA(tb[RTA_OIF]) == ifindex;
261 }
262
263 static int cb_clear_event(struct nl_msg *msg, void *arg)
264 {
265         struct clear_data *clr = arg;
266         struct nlmsghdr *hdr = nlmsg_hdr(msg);
267         bool (*cb)(struct nlmsghdr *, int ifindex);
268         int type;
269
270         switch(clr->type) {
271         case RTM_GETADDR:
272                 type = RTM_DELADDR;
273                 if (hdr->nlmsg_type != RTM_NEWADDR)
274                         return NL_SKIP;
275
276                 cb = check_ifaddr;
277                 break;
278         case RTM_GETROUTE:
279                 type = RTM_DELROUTE;
280                 if (hdr->nlmsg_type != RTM_NEWROUTE)
281                         return NL_SKIP;
282
283                 cb = check_route;
284                 break;
285         default:
286                 return NL_SKIP;
287         }
288
289         if (!cb(hdr, clr->dev->ifindex))
290                 return NL_SKIP;
291
292         D(SYSTEM, "Remove %s from device %s\n",
293           type == RTM_DELADDR ? "an address" : "a route",
294           clr->dev->ifname);
295         memcpy(nlmsg_hdr(clr->msg), hdr, hdr->nlmsg_len);
296         hdr = nlmsg_hdr(clr->msg);
297         hdr->nlmsg_type = type;
298         hdr->nlmsg_flags = NLM_F_REQUEST;
299
300         if (!nl_send_auto_complete(sock_rtnl, clr->msg))
301                 nl_wait_for_ack(sock_rtnl);
302
303         return NL_SKIP;
304 }
305
306 static int
307 cb_finish_event(struct nl_msg *msg, void *arg)
308 {
309         int *pending = arg;
310         *pending = 0;
311         return NL_STOP;
312 }
313
314 static int
315 error_handler(struct sockaddr_nl *nla, struct nlmsgerr *err, void *arg)
316 {
317         int *pending = arg;
318         *pending = err->error;
319         return NL_STOP;
320 }
321
322 static void
323 system_if_clear_entries(struct device *dev, int type, int af)
324 {
325         struct clear_data clr;
326         struct nl_cb *cb = nl_cb_alloc(NL_CB_DEFAULT);
327         struct rtmsg rtm = {
328                 .rtm_family = af,
329                 .rtm_flags = RTM_F_CLONED,
330         };
331         int flags = NLM_F_DUMP;
332         int pending = 1;
333
334         clr.af = af;
335         clr.dev = dev;
336         clr.type = type;
337         switch (type) {
338         case RTM_GETADDR:
339                 clr.size = sizeof(struct rtgenmsg);
340                 break;
341         case RTM_GETROUTE:
342                 clr.size = sizeof(struct rtmsg);
343                 break;
344         default:
345                 return;
346         }
347
348         if (!cb)
349                 return;
350
351         clr.msg = nlmsg_alloc_simple(type, flags);
352         if (!clr.msg)
353                 goto out;
354
355         nlmsg_append(clr.msg, &rtm, clr.size, 0);
356         nl_cb_set(cb, NL_CB_VALID, NL_CB_CUSTOM, cb_clear_event, &clr);
357         nl_cb_set(cb, NL_CB_FINISH, NL_CB_CUSTOM, cb_finish_event, &pending);
358         nl_cb_err(cb, NL_CB_CUSTOM, error_handler, &pending);
359
360         nl_send_auto_complete(sock_rtnl, clr.msg);
361         while (pending > 0)
362                 nl_recvmsgs(sock_rtnl, cb);
363
364         nlmsg_free(clr.msg);
365 out:
366         nl_cb_put(cb);
367 }
368
369 /*
370  * Clear bridge (membership) state and bring down device
371  */
372 void system_if_clear_state(struct device *dev)
373 {
374         static char buf[256];
375         char *bridge;
376
377         if (dev->external)
378                 return;
379
380         dev->ifindex = system_if_resolve(dev);
381         if (!dev->ifindex)
382                 return;
383
384         system_if_flags(dev->ifname, 0, IFF_UP);
385
386         if (system_is_bridge(dev->ifname, buf, sizeof(buf))) {
387                 D(SYSTEM, "Delete existing bridge named '%s'\n", dev->ifname);
388                 system_bridge_delbr(dev);
389                 return;
390         }
391
392         bridge = system_get_bridge(dev->ifname, buf, sizeof(buf));
393         if (bridge) {
394                 D(SYSTEM, "Remove device '%s' from bridge '%s'\n", dev->ifname, bridge);
395                 system_bridge_if(bridge, dev, SIOCBRDELIF, NULL);
396         }
397
398         system_if_clear_entries(dev, RTM_GETROUTE, AF_INET);
399         system_if_clear_entries(dev, RTM_GETADDR, AF_INET);
400         system_if_clear_entries(dev, RTM_GETROUTE, AF_INET6);
401         system_if_clear_entries(dev, RTM_GETADDR, AF_INET6);
402         system_set_disable_ipv6(dev, "0");
403 }
404
405 static inline unsigned long
406 sec_to_jiffies(int val)
407 {
408         return (unsigned long) val * 100;
409 }
410
411 int system_bridge_addbr(struct device *bridge, struct bridge_config *cfg)
412 {
413         unsigned long args[4] = {};
414
415         if (ioctl(sock_ioctl, SIOCBRADDBR, bridge->ifname) < 0)
416                 return -1;
417
418         args[0] = BRCTL_SET_BRIDGE_STP_STATE;
419         args[1] = !!cfg->stp;
420         system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
421
422         args[0] = BRCTL_SET_BRIDGE_FORWARD_DELAY;
423         args[1] = sec_to_jiffies(cfg->forward_delay);
424         system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
425
426         system_set_dev_sysctl("/sys/devices/virtual/net/%s/bridge/multicast_snooping",
427                 bridge->ifname, cfg->igmp_snoop ? "1" : "0");
428
429         if (cfg->flags & BRIDGE_OPT_AGEING_TIME) {
430                 args[0] = BRCTL_SET_AGEING_TIME;
431                 args[1] = sec_to_jiffies(cfg->ageing_time);
432                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
433         }
434
435         if (cfg->flags & BRIDGE_OPT_HELLO_TIME) {
436                 args[0] = BRCTL_SET_BRIDGE_HELLO_TIME;
437                 args[1] = sec_to_jiffies(cfg->hello_time);
438                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
439         }
440
441         if (cfg->flags & BRIDGE_OPT_MAX_AGE) {
442                 args[0] = BRCTL_SET_BRIDGE_MAX_AGE;
443                 args[1] = sec_to_jiffies(cfg->max_age);
444                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
445         }
446
447         return 0;
448 }
449
450 static int system_vlan(struct device *dev, int id)
451 {
452         struct vlan_ioctl_args ifr = {
453                 .cmd = SET_VLAN_NAME_TYPE_CMD,
454                 .u.name_type = VLAN_NAME_TYPE_RAW_PLUS_VID_NO_PAD,
455         };
456
457         ioctl(sock_ioctl, SIOCSIFVLAN, &ifr);
458
459         if (id < 0) {
460                 ifr.cmd = DEL_VLAN_CMD;
461                 ifr.u.VID = 0;
462         } else {
463                 ifr.cmd = ADD_VLAN_CMD;
464                 ifr.u.VID = id;
465         }
466         strncpy(ifr.device1, dev->ifname, sizeof(ifr.device1));
467         return ioctl(sock_ioctl, SIOCSIFVLAN, &ifr);
468 }
469
470 int system_vlan_add(struct device *dev, int id)
471 {
472         return system_vlan(dev, id);
473 }
474
475 int system_vlan_del(struct device *dev)
476 {
477         return system_vlan(dev, -1);
478 }
479
480 static void
481 system_if_apply_settings(struct device *dev)
482 {
483         struct ifreq ifr;
484
485         memset(&ifr, 0, sizeof(ifr));
486         strncpy(ifr.ifr_name, dev->ifname, sizeof(ifr.ifr_name));
487         if (dev->flags & DEV_OPT_MTU) {
488                 ifr.ifr_mtu = dev->mtu;
489                 ioctl(sock_ioctl, SIOCSIFMTU, &ifr);
490         }
491         if (dev->flags & DEV_OPT_TXQUEUELEN) {
492                 ifr.ifr_qlen = dev->txqueuelen;
493                 ioctl(sock_ioctl, SIOCSIFTXQLEN, &ifr);
494         }
495         if (dev->flags & DEV_OPT_MACADDR) {
496                 memcpy(&ifr.ifr_hwaddr, dev->macaddr, sizeof(dev->macaddr));
497                 ioctl(sock_ioctl, SIOCSIFHWADDR, &ifr);
498         }
499
500         dev->ifindex = system_if_resolve(dev);
501 }
502
503 int system_if_up(struct device *dev)
504 {
505         system_if_apply_settings(dev);
506         return system_if_flags(dev->ifname, IFF_UP, 0);
507 }
508
509 int system_if_down(struct device *dev)
510 {
511         return system_if_flags(dev->ifname, 0, IFF_UP);
512 }
513
514 int system_if_check(struct device *dev)
515 {
516         device_set_present(dev, (system_if_resolve(dev) >= 0));
517         return 0;
518 }
519
520 int system_if_dump_stats(struct device *dev, struct blob_buf *b)
521 {
522         const char *const counters[] = {
523                 "collisions",     "rx_frame_errors",   "tx_compressed",
524                 "multicast",      "rx_length_errors",  "tx_dropped",
525                 "rx_bytes",       "rx_missed_errors",  "tx_errors",
526                 "rx_compressed",  "rx_over_errors",    "tx_fifo_errors",
527                 "rx_crc_errors",  "rx_packets",        "tx_heartbeat_errors",
528                 "rx_dropped",     "tx_aborted_errors", "tx_packets",
529                 "rx_errors",      "tx_bytes",          "tx_window_errors",
530                 "rx_fifo_errors", "tx_carrier_errors",
531         };
532         char buf[64];
533         int stats_dir;
534         int i, fd, len;
535
536         snprintf(buf, sizeof(buf), "/sys/class/net/%s/statistics", dev->ifname);
537         stats_dir = open(buf, O_DIRECTORY);
538         if (stats_dir < 0)
539                 return -1;
540
541         for (i = 0; i < ARRAY_SIZE(counters); i++) {
542                 fd = openat(stats_dir, counters[i], O_RDONLY);
543                 if (fd < 0)
544                         continue;
545
546 retry:
547                 len = read(fd, buf, sizeof(buf));
548                 if (len < 0) {
549                         if (errno == EINTR)
550                                 goto retry;
551                         continue;
552                 }
553
554                 buf[len] = 0;
555                 blobmsg_add_u32(b, counters[i], strtoul(buf, NULL, 0));
556                 close(fd);
557         }
558
559         close(stats_dir);
560         return 0;
561 }
562
563 static int system_addr(struct device *dev, struct device_addr *addr, int cmd)
564 {
565         int alen = ((addr->flags & DEVADDR_FAMILY) == DEVADDR_INET4) ? 4 : 16;
566         struct ifaddrmsg ifa = {
567                 .ifa_family = (alen == 4) ? AF_INET : AF_INET6,
568                 .ifa_prefixlen = addr->mask,
569                 .ifa_index = dev->ifindex,
570         };
571
572         struct nl_msg *msg;
573
574         dev = addr->device;
575         if (dev) {
576                 if (!dev->ifindex)
577                         return -1;
578
579                 ifa.ifa_index = dev->ifindex;
580         }
581
582         msg = nlmsg_alloc_simple(cmd, 0);
583         if (!msg)
584                 return -1;
585
586         nlmsg_append(msg, &ifa, sizeof(ifa), 0);
587         nla_put(msg, IFA_LOCAL, alen, &addr->addr);
588         return system_rtnl_call(msg);
589 }
590
591 int system_add_address(struct device *dev, struct device_addr *addr)
592 {
593         return system_addr(dev, addr, RTM_NEWADDR);
594 }
595
596 int system_del_address(struct device *dev, struct device_addr *addr)
597 {
598         return system_addr(dev, addr, RTM_DELADDR);
599 }
600
601 static int system_rt(struct device *dev, struct device_route *route, int cmd)
602 {
603         int alen = ((route->flags & DEVADDR_FAMILY) == DEVADDR_INET4) ? 4 : 16;
604         bool have_gw;
605         unsigned int flags = 0;
606         int ifindex = dev->ifindex;
607
608         if (alen == 4)
609                 have_gw = !!route->nexthop.in.s_addr;
610         else
611                 have_gw = route->nexthop.in6.s6_addr32[0] ||
612                         route->nexthop.in6.s6_addr32[1] ||
613                         route->nexthop.in6.s6_addr32[2] ||
614                         route->nexthop.in6.s6_addr32[3];
615
616         unsigned char scope = (cmd == RTM_DELROUTE) ? RT_SCOPE_NOWHERE :
617                         (have_gw) ? RT_SCOPE_UNIVERSE : RT_SCOPE_LINK;
618
619         struct rtmsg rtm = {
620                 .rtm_family = (alen == 4) ? AF_INET : AF_INET6,
621                 .rtm_dst_len = route->mask,
622                 .rtm_table = RT_TABLE_MAIN,
623                 .rtm_protocol = RTPROT_BOOT,
624                 .rtm_scope = scope,
625                 .rtm_type = (cmd == RTM_DELROUTE) ? 0: RTN_UNICAST,
626         };
627         struct nl_msg *msg;
628
629         if (cmd == RTM_NEWROUTE)
630                 flags |= NLM_F_CREATE | NLM_F_REPLACE;
631
632         dev = route->device;
633         if (dev) {
634                 if (!dev->ifindex)
635                         return -1;
636
637                 ifindex = dev->ifindex;
638         }
639
640         msg = nlmsg_alloc_simple(cmd, flags);
641         if (!msg)
642                 return -1;
643
644         nlmsg_append(msg, &rtm, sizeof(rtm), 0);
645
646         if (route->mask)
647                 nla_put(msg, RTA_DST, alen, &route->addr);
648
649         if (have_gw)
650                 nla_put(msg, RTA_GATEWAY, alen, &route->nexthop);
651
652         if (route->flags & DEVADDR_DEVICE)
653                 nla_put_u32(msg, RTA_OIF, ifindex);
654
655         return system_rtnl_call(msg);
656 }
657
658 int system_add_route(struct device *dev, struct device_route *route)
659 {
660         return system_rt(dev, route, RTM_NEWROUTE);
661 }
662
663 int system_del_route(struct device *dev, struct device_route *route)
664 {
665         return system_rt(dev, route, RTM_DELROUTE);
666 }
667
668 int system_flush_routes(void)
669 {
670         const char *names[] = {
671                 "/proc/sys/net/ipv4/route/flush",
672                 "/proc/sys/net/ipv6/route/flush"
673         };
674         int fd, i;
675
676         for (i = 0; i < ARRAY_SIZE(names); i++) {
677                 fd = open(names[i], O_WRONLY);
678                 if (fd < 0)
679                         continue;
680
681                 write(fd, "-1", 2);
682                 close(fd);
683         }
684         return 0;
685 }
686
687 time_t system_get_rtime(void)
688 {
689         struct timespec ts;
690         struct timeval tv;
691
692         if (syscall(__NR_clock_gettime, CLOCK_MONOTONIC, &ts) == 0)
693                 return ts.tv_sec;
694
695         if (gettimeofday(&tv, NULL) == 0)
696                 return tv.tv_sec;
697
698         return 0;
699 }