Для тех, кто привык работать с нормальным CLI (Juniper, Cisco и Cisco-like), CLI свитчей типа D-Link, Zyxel и т.п. покажутся просто интерфейсом над регистрами чипа коммутации. Эта заметка посвящена тому, как можно легко ошибиться, когда производитель не особо задумывается над высокоуровневыми задачами, а лишь транслирует команды CLI в регистры/команды чипа.
Тривиальная схема включения, ошибиться вроде бы негде. Однако, суть проблемы в том, что когда абонент подключает ноутбук с Windows, то всё работает (есть пинги между Cust_host1 и ISP_R1). Когда же подключается (заведомо рабочий) роутер Cust_R2 вместо Cust_host1, пинги до ISP_R1 перестают ходить.
Проведя стандартную диагностику и даже клонировав мак компьютера на Cust_R2, ситуация не прояснилась. При том, со стороны оборудования ISP всё выглядело так, как будто бы неисправен или частично не настроен роутер Cust_R2, мало того, его мак-адрес появлялся в arp-таблице, т.е. по крайней мере на нём был прописан правильный IP-адрес (абонент включен по схеме /30, выделенный влан).
После детального изучения конфигурации ISP_SW1 в нём была замечена странная вещь:
vlan 200 normal 1-11 fixed 1,12 forbidden "" untagged "" exit interface port-channel 1 pvid 200 exit
(на port-channel не обращайте внимание, в самом деле это просто port, lagg тут ни при чём)
Как видно, список портов untagged пустой, хотя трафик к этому абоненту должен идти без тега. Добавив порт 1 в список untagged, всё заработало. И вроде бы всё понятно, простая ошибка конфигурации, но как же оно работало с Windows PC? И тут я вспомнил, что некоторые сетевые карточки(или их драйвер) в Windows просто снимают dot1Q тег и трафик в систему приходит как бы без тега, что и произошло с этим абонентом. От него трафик принимался без тега и попадал в нужный влан (т.к. на порту прописана команда pvid), а к нему уходил с тегом 200. Windows-у тег оказался не страшен, а вот роутер просто дропал весь трафик, приходящий к нему. Итого, абонент оператора ждал неделю (после окончания монтажа), несколько выездов на сайт к нему, а виной всему нетиповая схема подключения(от свитча агрегации) и работающий Windows(хотя работать не должен бы).
Вот так подстава))
Ага, когда мне показали этот тикет, там даже дампы трафика были и 100500 комментариев(и тегов там тоже не было)