0308e6f3e6ed5b08af95a0a0845d05a2edda977a
[project/netifd.git] / system-linux.c
1 #define _GNU_SOURCE
2
3 #include <sys/socket.h>
4 #include <sys/ioctl.h>
5 #include <sys/stat.h>
6 #include <sys/syscall.h>
7
8 #include <linux/rtnetlink.h>
9 #include <linux/sockios.h>
10 #include <linux/if_vlan.h>
11 #include <linux/if_bridge.h>
12
13 #include <unistd.h>
14 #include <string.h>
15 #include <fcntl.h>
16 #include <glob.h>
17
18 #include <netlink/msg.h>
19 #include <netlink/attr.h>
20 #include <netlink/socket.h>
21 #include <libubox/uloop.h>
22
23 #include "netifd.h"
24 #include "device.h"
25 #include "system.h"
26
27 struct event_socket {
28         struct uloop_fd uloop;
29         struct nl_sock *sock;
30         struct nl_cb *cb;
31 };
32
33 static int sock_ioctl = -1;
34 static struct nl_sock *sock_rtnl = NULL;
35
36 static int cb_rtnl_event(struct nl_msg *msg, void *arg);
37
38 static void
39 handler_nl_event(struct uloop_fd *u, unsigned int events)
40 {
41         struct event_socket *ev = container_of(u, struct event_socket, uloop);
42         nl_recvmsgs(ev->sock, ev->cb);
43 }
44
45 static struct nl_sock *
46 create_socket(int protocol)
47 {
48         struct nl_sock *sock;
49
50         sock = nl_socket_alloc();
51         if (!sock)
52                 return NULL;
53
54         if (nl_connect(sock, protocol))
55                 return NULL;
56
57         return sock;
58 }
59
60 static bool
61 create_event_socket(struct event_socket *ev, int protocol,
62                     int (*cb)(struct nl_msg *msg, void *arg))
63 {
64         // Prepare socket for link events
65         ev->cb = nl_cb_alloc(NL_CB_DEFAULT);
66         if (!ev->cb)
67                 return false;
68
69         nl_cb_set(ev->cb, NL_CB_VALID, NL_CB_CUSTOM, cb, NULL);
70
71         ev->sock = create_socket(protocol);
72         if (!ev->sock)
73                 return false;
74
75         ev->uloop.fd = nl_socket_get_fd(ev->sock);
76         ev->uloop.cb = handler_nl_event;
77         uloop_fd_add(&ev->uloop, ULOOP_READ | ULOOP_EDGE_TRIGGER);
78         return true;
79 }
80
81 int system_init(void)
82 {
83         static struct event_socket rtnl_event;
84
85         sock_ioctl = socket(AF_LOCAL, SOCK_DGRAM, 0);
86         fcntl(sock_ioctl, F_SETFD, fcntl(sock_ioctl, F_GETFD) | FD_CLOEXEC);
87
88         // Prepare socket for routing / address control
89         sock_rtnl = create_socket(NETLINK_ROUTE);
90         if (!sock_rtnl)
91                 return -1;
92
93         if (!create_event_socket(&rtnl_event, NETLINK_ROUTE, cb_rtnl_event))
94                 return -1;
95
96         // Receive network link events form kernel
97         nl_socket_add_membership(rtnl_event.sock, RTNLGRP_LINK);
98
99         return 0;
100 }
101
102 static void system_set_sysctl(const char *path, const char *val)
103 {
104         int fd;
105
106         fd = open(path, O_WRONLY);
107         if (fd < 0)
108                 return;
109
110         write(fd, val, strlen(val));
111         close(fd);
112 }
113
114 static void system_set_dev_sysctl(const char *path, const char *device, const char *val)
115 {
116         static char buf[256];
117
118         snprintf(buf, sizeof(buf), path, val);
119         system_set_sysctl(buf, val);
120 }
121
122 static void system_set_disable_ipv6(struct device *dev, const char *val)
123 {
124         system_set_dev_sysctl("/proc/sys/net/ipv6/conf/%s/disable_ipv6", dev->ifname, val);
125 }
126
127 // Evaluate netlink messages
128 static int cb_rtnl_event(struct nl_msg *msg, void *arg)
129 {
130         struct nlmsghdr *nh = nlmsg_hdr(msg);
131         struct ifinfomsg *ifi = NLMSG_DATA(nh);
132         struct nlattr *nla[__IFLA_MAX];
133
134         if (nh->nlmsg_type != RTM_DELLINK && nh->nlmsg_type != RTM_NEWLINK)
135                 goto out;
136
137         nlmsg_parse(nh, sizeof(*ifi), nla, __IFLA_MAX - 1, NULL);
138         if (!nla[IFLA_IFNAME])
139                 goto out;
140
141         struct device *dev = device_get(RTA_DATA(nla[IFLA_IFNAME]), false);
142         if (!dev)
143                 goto out;
144
145         dev->ifindex = ifi->ifi_index;
146         device_set_present(dev, (nh->nlmsg_type == RTM_NEWLINK));
147
148 out:
149         return 0;
150 }
151
152 static int system_rtnl_call(struct nl_msg *msg)
153 {
154         int s = -(nl_send_auto_complete(sock_rtnl, msg)
155                         || nl_wait_for_ack(sock_rtnl));
156         nlmsg_free(msg);
157         return s;
158 }
159
160 int system_bridge_delbr(struct device *bridge)
161 {
162         return ioctl(sock_ioctl, SIOCBRDELBR, bridge->ifname);
163 }
164
165 static int system_bridge_if(const char *bridge, struct device *dev, int cmd, void *data)
166 {
167         struct ifreq ifr;
168         if (dev)
169                 ifr.ifr_ifindex = dev->ifindex;
170         else
171                 ifr.ifr_data = data;
172         strncpy(ifr.ifr_name, bridge, sizeof(ifr.ifr_name));
173         return ioctl(sock_ioctl, cmd, &ifr);
174 }
175
176 int system_bridge_addif(struct device *bridge, struct device *dev)
177 {
178         system_set_disable_ipv6(dev, "1");
179         return system_bridge_if(bridge->ifname, dev, SIOCBRADDIF, NULL);
180 }
181
182 int system_bridge_delif(struct device *bridge, struct device *dev)
183 {
184         system_set_disable_ipv6(dev, "0");
185         return system_bridge_if(bridge->ifname, dev, SIOCBRDELIF, NULL);
186 }
187
188 static bool system_is_bridge(const char *name, char *buf, int buflen)
189 {
190         struct stat st;
191
192         snprintf(buf, buflen, "/sys/devices/virtual/net/%s/bridge", name);
193         if (stat(buf, &st) < 0)
194                 return false;
195
196         return true;
197 }
198
199 static char *system_get_bridge(const char *name, char *buf, int buflen)
200 {
201         char *path;
202         ssize_t len;
203         glob_t gl;
204
205         snprintf(buf, buflen, "/sys/devices/virtual/net/*/brif/%s/bridge", name);
206         if (glob(buf, GLOB_NOSORT, NULL, &gl) < 0)
207                 return NULL;
208
209         if (gl.gl_pathc == 0)
210                 return NULL;
211
212         len = readlink(gl.gl_pathv[0], buf, buflen);
213         if (len < 0)
214                 return NULL;
215
216         buf[len] = 0;
217         path = strrchr(buf, '/');
218         if (!path)
219                 return NULL;
220
221         return path + 1;
222 }
223
224 static int system_if_resolve(struct device *dev)
225 {
226         struct ifreq ifr;
227         strncpy(ifr.ifr_name, dev->ifname, sizeof(ifr.ifr_name));
228         if (!ioctl(sock_ioctl, SIOCGIFINDEX, &ifr))
229                 return ifr.ifr_ifindex;
230         else
231                 return 0;
232 }
233
234 static int system_if_flags(const char *ifname, unsigned add, unsigned rem)
235 {
236         struct ifreq ifr;
237         strncpy(ifr.ifr_name, ifname, sizeof(ifr.ifr_name));
238         ioctl(sock_ioctl, SIOCGIFFLAGS, &ifr);
239         ifr.ifr_flags |= add;
240         ifr.ifr_flags &= ~rem;
241         return ioctl(sock_ioctl, SIOCSIFFLAGS, &ifr);
242 }
243
244 struct clear_data {
245         struct nl_msg *msg;
246         struct device *dev;
247         int type;
248         int size;
249         int af;
250 };
251
252
253 static bool check_ifaddr(struct nlmsghdr *hdr, int ifindex)
254 {
255         struct ifaddrmsg *ifa = NLMSG_DATA(hdr);
256
257         return ifa->ifa_index == ifindex;
258 }
259
260 static bool check_route(struct nlmsghdr *hdr, int ifindex)
261 {
262         struct nlattr *tb[__RTA_MAX];
263
264         nlmsg_parse(hdr, sizeof(struct rtmsg), tb, __RTA_MAX - 1, NULL);
265         if (!tb[RTA_OIF])
266                 return false;
267
268         return *(int *)RTA_DATA(tb[RTA_OIF]) == ifindex;
269 }
270
271 static int cb_clear_event(struct nl_msg *msg, void *arg)
272 {
273         struct clear_data *clr = arg;
274         struct nlmsghdr *hdr = nlmsg_hdr(msg);
275         bool (*cb)(struct nlmsghdr *, int ifindex);
276         int type;
277
278         switch(clr->type) {
279         case RTM_GETADDR:
280                 type = RTM_DELADDR;
281                 if (hdr->nlmsg_type != RTM_NEWADDR)
282                         return NL_SKIP;
283
284                 cb = check_ifaddr;
285                 break;
286         case RTM_GETROUTE:
287                 type = RTM_DELROUTE;
288                 if (hdr->nlmsg_type != RTM_NEWROUTE)
289                         return NL_SKIP;
290
291                 cb = check_route;
292                 break;
293         default:
294                 return NL_SKIP;
295         }
296
297         if (!cb(hdr, clr->dev->ifindex))
298                 return NL_SKIP;
299
300         D(SYSTEM, "Remove %s from device %s\n",
301           type == RTM_DELADDR ? "an address" : "a route",
302           clr->dev->ifname);
303         memcpy(nlmsg_hdr(clr->msg), hdr, hdr->nlmsg_len);
304         hdr = nlmsg_hdr(clr->msg);
305         hdr->nlmsg_type = type;
306         hdr->nlmsg_flags = NLM_F_REQUEST;
307
308         if (!nl_send_auto_complete(sock_rtnl, clr->msg))
309                 nl_wait_for_ack(sock_rtnl);
310
311         return NL_SKIP;
312 }
313
314 static int
315 cb_finish_event(struct nl_msg *msg, void *arg)
316 {
317         int *pending = arg;
318         *pending = 0;
319         return NL_STOP;
320 }
321
322 static int
323 error_handler(struct sockaddr_nl *nla, struct nlmsgerr *err, void *arg)
324 {
325         int *pending = arg;
326         *pending = err->error;
327         return NL_STOP;
328 }
329
330 static void
331 system_if_clear_entries(struct device *dev, int type, int af)
332 {
333         struct clear_data clr;
334         struct nl_cb *cb = nl_cb_alloc(NL_CB_DEFAULT);
335         struct rtmsg rtm = {
336                 .rtm_family = af,
337                 .rtm_flags = RTM_F_CLONED,
338         };
339         int flags = NLM_F_DUMP;
340         int pending = 1;
341
342         clr.af = af;
343         clr.dev = dev;
344         clr.type = type;
345         switch (type) {
346         case RTM_GETADDR:
347                 clr.size = sizeof(struct rtgenmsg);
348                 break;
349         case RTM_GETROUTE:
350                 clr.size = sizeof(struct rtmsg);
351                 break;
352         default:
353                 return;
354         }
355
356         if (!cb)
357                 return;
358
359         clr.msg = nlmsg_alloc_simple(type, flags);
360         if (!clr.msg)
361                 goto out;
362
363         nlmsg_append(clr.msg, &rtm, clr.size, 0);
364         nl_cb_set(cb, NL_CB_VALID, NL_CB_CUSTOM, cb_clear_event, &clr);
365         nl_cb_set(cb, NL_CB_FINISH, NL_CB_CUSTOM, cb_finish_event, &pending);
366         nl_cb_err(cb, NL_CB_CUSTOM, error_handler, &pending);
367
368         nl_send_auto_complete(sock_rtnl, clr.msg);
369         while (pending > 0)
370                 nl_recvmsgs(sock_rtnl, cb);
371
372         nlmsg_free(clr.msg);
373 out:
374         nl_cb_put(cb);
375 }
376
377 /*
378  * Clear bridge (membership) state and bring down device
379  */
380 void system_if_clear_state(struct device *dev)
381 {
382         static char buf[256];
383         char *bridge;
384
385         if (dev->external)
386                 return;
387
388         dev->ifindex = system_if_resolve(dev);
389         if (!dev->ifindex)
390                 return;
391
392         system_if_flags(dev->ifname, 0, IFF_UP);
393
394         if (system_is_bridge(dev->ifname, buf, sizeof(buf))) {
395                 D(SYSTEM, "Delete existing bridge named '%s'\n", dev->ifname);
396                 system_bridge_delbr(dev);
397                 return;
398         }
399
400         bridge = system_get_bridge(dev->ifname, buf, sizeof(buf));
401         if (bridge) {
402                 D(SYSTEM, "Remove device '%s' from bridge '%s'\n", dev->ifname, bridge);
403                 system_bridge_if(bridge, dev, SIOCBRDELIF, NULL);
404         }
405
406         system_if_clear_entries(dev, RTM_GETROUTE, AF_INET);
407         system_if_clear_entries(dev, RTM_GETADDR, AF_INET);
408         system_if_clear_entries(dev, RTM_GETROUTE, AF_INET6);
409         system_if_clear_entries(dev, RTM_GETADDR, AF_INET6);
410         system_set_disable_ipv6(dev, "0");
411 }
412
413 static inline unsigned long
414 sec_to_jiffies(int val)
415 {
416         return (unsigned long) val * 100;
417 }
418
419 int system_bridge_addbr(struct device *bridge, struct bridge_config *cfg)
420 {
421         unsigned long args[4] = {};
422
423         if (ioctl(sock_ioctl, SIOCBRADDBR, bridge->ifname) < 0)
424                 return -1;
425
426         args[0] = BRCTL_SET_BRIDGE_STP_STATE;
427         args[1] = !!cfg->stp;
428         system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
429
430         args[0] = BRCTL_SET_BRIDGE_FORWARD_DELAY;
431         args[1] = sec_to_jiffies(cfg->forward_delay);
432         system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
433
434         system_set_dev_sysctl("/sys/devices/virtual/net/%s/bridge/multicast_snooping",
435                 bridge->ifname, cfg->igmp_snoop ? "1" : "0");
436
437         if (cfg->flags & BRIDGE_OPT_AGEING_TIME) {
438                 args[0] = BRCTL_SET_AGEING_TIME;
439                 args[1] = sec_to_jiffies(cfg->ageing_time);
440                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
441         }
442
443         if (cfg->flags & BRIDGE_OPT_HELLO_TIME) {
444                 args[0] = BRCTL_SET_BRIDGE_HELLO_TIME;
445                 args[1] = sec_to_jiffies(cfg->hello_time);
446                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
447         }
448
449         if (cfg->flags & BRIDGE_OPT_MAX_AGE) {
450                 args[0] = BRCTL_SET_BRIDGE_MAX_AGE;
451                 args[1] = sec_to_jiffies(cfg->max_age);
452                 system_bridge_if(bridge->ifname, NULL, SIOCDEVPRIVATE, &args);
453         }
454
455         return 0;
456 }
457
458 static int system_vlan(struct device *dev, int id)
459 {
460         struct vlan_ioctl_args ifr = {
461                 .cmd = SET_VLAN_NAME_TYPE_CMD,
462                 .u.name_type = VLAN_NAME_TYPE_RAW_PLUS_VID_NO_PAD,
463         };
464
465         ioctl(sock_ioctl, SIOCSIFVLAN, &ifr);
466
467         if (id < 0) {
468                 ifr.cmd = DEL_VLAN_CMD;
469                 ifr.u.VID = 0;
470         } else {
471                 ifr.cmd = ADD_VLAN_CMD;
472                 ifr.u.VID = id;
473         }
474         strncpy(ifr.device1, dev->ifname, sizeof(ifr.device1));
475         return ioctl(sock_ioctl, SIOCSIFVLAN, &ifr);
476 }
477
478 int system_vlan_add(struct device *dev, int id)
479 {
480         return system_vlan(dev, id);
481 }
482
483 int system_vlan_del(struct device *dev)
484 {
485         return system_vlan(dev, -1);
486 }
487
488 static void
489 system_if_apply_settings(struct device *dev)
490 {
491         struct ifreq ifr;
492
493         memset(&ifr, 0, sizeof(ifr));
494         strncpy(ifr.ifr_name, dev->ifname, sizeof(ifr.ifr_name));
495         if (dev->flags & DEV_OPT_MTU) {
496                 ifr.ifr_mtu = dev->mtu;
497                 ioctl(sock_ioctl, SIOCSIFMTU, &ifr);
498         }
499         if (dev->flags & DEV_OPT_TXQUEUELEN) {
500                 ifr.ifr_qlen = dev->txqueuelen;
501                 ioctl(sock_ioctl, SIOCSIFTXQLEN, &ifr);
502         }
503         if (dev->flags & DEV_OPT_MACADDR) {
504                 memcpy(&ifr.ifr_hwaddr, dev->macaddr, sizeof(dev->macaddr));
505                 ioctl(sock_ioctl, SIOCSIFHWADDR, &ifr);
506         }
507
508         dev->ifindex = system_if_resolve(dev);
509 }
510
511 int system_if_up(struct device *dev)
512 {
513         system_if_apply_settings(dev);
514         return system_if_flags(dev->ifname, IFF_UP, 0);
515 }
516
517 int system_if_down(struct device *dev)
518 {
519         return system_if_flags(dev->ifname, 0, IFF_UP);
520 }
521
522 int system_if_check(struct device *dev)
523 {
524         device_set_present(dev, (system_if_resolve(dev) >= 0));
525         return 0;
526 }
527
528 int system_if_dump_stats(struct device *dev, struct blob_buf *b)
529 {
530         const char *const counters[] = {
531                 "collisions",     "rx_frame_errors",   "tx_compressed",
532                 "multicast",      "rx_length_errors",  "tx_dropped",
533                 "rx_bytes",       "rx_missed_errors",  "tx_errors",
534                 "rx_compressed",  "rx_over_errors",    "tx_fifo_errors",
535                 "rx_crc_errors",  "rx_packets",        "tx_heartbeat_errors",
536                 "rx_dropped",     "tx_aborted_errors", "tx_packets",
537                 "rx_errors",      "tx_bytes",          "tx_window_errors",
538                 "rx_fifo_errors", "tx_carrier_errors",
539         };
540         char buf[64];
541         int stats_dir;
542         int i, fd, len;
543
544         snprintf(buf, sizeof(buf), "/sys/class/net/%s/statistics", dev->ifname);
545         stats_dir = open(buf, O_DIRECTORY);
546         if (stats_dir < 0)
547                 return -1;
548
549         for (i = 0; i < ARRAY_SIZE(counters); i++) {
550                 fd = openat(stats_dir, counters[i], O_RDONLY);
551                 if (fd < 0)
552                         continue;
553
554 retry:
555                 len = read(fd, buf, sizeof(buf));
556                 if (len < 0) {
557                         if (errno == EINTR)
558                                 goto retry;
559                         continue;
560                 }
561
562                 buf[len] = 0;
563                 blobmsg_add_u32(b, counters[i], strtoul(buf, NULL, 0));
564                 close(fd);
565         }
566
567         close(stats_dir);
568         return 0;
569 }
570
571 static int system_addr(struct device *dev, struct device_addr *addr, int cmd)
572 {
573         int alen = ((addr->flags & DEVADDR_FAMILY) == DEVADDR_INET4) ? 4 : 16;
574         struct ifaddrmsg ifa = {
575                 .ifa_family = (alen == 4) ? AF_INET : AF_INET6,
576                 .ifa_prefixlen = addr->mask,
577                 .ifa_index = dev->ifindex,
578         };
579
580         struct nl_msg *msg;
581
582         dev = addr->device;
583         if (dev) {
584                 if (!dev->ifindex)
585                         return -1;
586
587                 ifa.ifa_index = dev->ifindex;
588         }
589
590         msg = nlmsg_alloc_simple(cmd, 0);
591         if (!msg)
592                 return -1;
593
594         nlmsg_append(msg, &ifa, sizeof(ifa), 0);
595         nla_put(msg, IFA_LOCAL, alen, &addr->addr);
596         return system_rtnl_call(msg);
597 }
598
599 int system_add_address(struct device *dev, struct device_addr *addr)
600 {
601         return system_addr(dev, addr, RTM_NEWADDR);
602 }
603
604 int system_del_address(struct device *dev, struct device_addr *addr)
605 {
606         return system_addr(dev, addr, RTM_DELADDR);
607 }
608
609 static int system_rt(struct device *dev, struct device_route *route, int cmd)
610 {
611         int alen = ((route->flags & DEVADDR_FAMILY) == DEVADDR_INET4) ? 4 : 16;
612         bool have_gw;
613         unsigned int flags = 0;
614         int ifindex = dev->ifindex;
615
616         if (alen == 4)
617                 have_gw = !!route->nexthop.in.s_addr;
618         else
619                 have_gw = route->nexthop.in6.s6_addr32[0] ||
620                         route->nexthop.in6.s6_addr32[1] ||
621                         route->nexthop.in6.s6_addr32[2] ||
622                         route->nexthop.in6.s6_addr32[3];
623
624         unsigned char scope = (cmd == RTM_DELROUTE) ? RT_SCOPE_NOWHERE :
625                         (have_gw) ? RT_SCOPE_UNIVERSE : RT_SCOPE_LINK;
626
627         struct rtmsg rtm = {
628                 .rtm_family = (alen == 4) ? AF_INET : AF_INET6,
629                 .rtm_dst_len = route->mask,
630                 .rtm_table = RT_TABLE_MAIN,
631                 .rtm_protocol = RTPROT_BOOT,
632                 .rtm_scope = scope,
633                 .rtm_type = (cmd == RTM_DELROUTE) ? 0: RTN_UNICAST,
634         };
635         struct nl_msg *msg;
636
637         if (cmd == RTM_NEWROUTE)
638                 flags |= NLM_F_CREATE | NLM_F_REPLACE;
639
640         dev = route->device;
641         if (dev) {
642                 if (!dev->ifindex)
643                         return -1;
644
645                 ifindex = dev->ifindex;
646         }
647
648         msg = nlmsg_alloc_simple(cmd, flags);
649         if (!msg)
650                 return -1;
651
652         nlmsg_append(msg, &rtm, sizeof(rtm), 0);
653
654         if (route->mask)
655                 nla_put(msg, RTA_DST, alen, &route->addr);
656
657         if (have_gw)
658                 nla_put(msg, RTA_GATEWAY, alen, &route->nexthop);
659
660         if (route->flags & DEVADDR_DEVICE)
661                 nla_put_u32(msg, RTA_OIF, ifindex);
662
663         return system_rtnl_call(msg);
664 }
665
666 int system_add_route(struct device *dev, struct device_route *route)
667 {
668         return system_rt(dev, route, RTM_NEWROUTE);
669 }
670
671 int system_del_route(struct device *dev, struct device_route *route)
672 {
673         return system_rt(dev, route, RTM_DELROUTE);
674 }
675
676 int system_flush_routes(void)
677 {
678         const char *names[] = {
679                 "/proc/sys/net/ipv4/route/flush",
680                 "/proc/sys/net/ipv6/route/flush"
681         };
682         int fd, i;
683
684         for (i = 0; i < ARRAY_SIZE(names); i++) {
685                 fd = open(names[i], O_WRONLY);
686                 if (fd < 0)
687                         continue;
688
689                 write(fd, "-1", 2);
690                 close(fd);
691         }
692         return 0;
693 }
694
695 time_t system_get_rtime(void)
696 {
697         struct timespec ts;
698         struct timeval tv;
699
700         if (syscall(__NR_clock_gettime, CLOCK_MONOTONIC, &ts) == 0)
701                 return ts.tv_sec;
702
703         if (gettimeofday(&tv, NULL) == 0)
704                 return tv.tv_sec;
705
706         return 0;
707 }