skip to Main Content

huawei network ekipmanlarında alarm nedeniyle kapanmış olan arayüzlerin açılması

bir çok router ve switchte herhangi bir arayüz üzerindeki servislerde veya portta fiziksel hataların tespiti ile o arayüz üzerindeki servislerin / trafiğin daha fazla etkilenmemesi için arayüzü kapatabilirsiniz.

huawei network ekipmanlarında benzer şekilde kapatılmış arayüzlerin tespitini yapmak için farklı yöntemler mevcut.

display trapbuffer ve display logbuffer ile log incelemesi yapılabilir. display interface brief ile loop v.b. durumlar gözlemlenebilir.

en temel olanı ise arayüze doğrudan bakmak.

[test_router-GigabitEthernet1/0/1]display interface GigabitEthernet 1/0/1
GigabitEthernet1/0/1 current state : Port-alarm DOWN
Line protocol current state : DOWN
Link quality grade : --
Description:test-interface
Route Port,The Maximum Transmit Unit is 9212
Internet Address is 11.12.13.17/31
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is bc3d-39ef-f236
The Vendor PN is MTRS-02X13-G
The Vendor Name is HG GENUINE
Port BW: 10G, Transceiver max BW: 10G, Transceiver Mode: SingleMode
WaveLength: 1310nm, Transmission Distance: 10km
Rx Power: -2.09dBm, Warning range: [-14.40,  0.50]dBm
Tx Power: -40.00dBm, Warning range: [-8.20,  0.50]dBm
Loopback:none, LAN full-duplex mode, Pause Flowcontrol:Receive Enable and Send Enable
Last physical up time   : 2020-08-22 14:27:21 UTC+03:00
Last physical down time : 2020-08-22 14:27:23 UTC+03:00
Current system time: 2020-08-22 17:31:33+03:00
Statistics last cleared:2020-08-22 16:32:36
    Last 10 seconds input rate: 0 bits/sec, 0 packets/sec
    Last 10 seconds output rate: 0 bits/sec, 0 packets/sec
    Input: 0 bytes, 0 packets
    Output: 0 bytes, 0 packets
    Input:
      Unicast: 0 packets, Multicast: 0 packets
      Broadcast: 0 packets, JumboOctets: 0 packets
      CRC: 0 packets, Symbol: 0 packets
      Overrun: 0 packets, InRangeLength: 0 packets
      LongPacket: 0 packets, Jabber: 0 packets, Alignment: 0 packets
      Fragment: 0 packets, Undersized Frame: 0 packets
      RxPause: 0 packets
    Output:
      Unicast: 0 packets, Multicast: 0 packets
      Broadcast: 0 packets, JumboOctets: 0 packets
      Lost: 0 packets, Overflow: 0 packets, Underrun: 0 packets
      System: 0 packets, Overrun: 0 packets
      TxPause: 0 packets
      Unknown Vlan: 0 packets
    Input bandwidth utilization  :    0%
    Output bandwidth utilization :    0%

veya

[test_router-GigabitEthernet1/0/1]display interface phy-option GigabitEthernet 1/0/1
GigabitEthernet1/0/1
Port Physical Status    :DOWN
Physical Down Reason    :PORT_ALARM_DOWN
Loopback                :none
Duplex mode             :full-duplex
Pause Flowcontrol:
Receive                 :Enable
Send                    :Enable
SFP imformation:
The Vendor PN is MTRS-02X13-G    
The Vendor Name is HG GENUINE      
Port BW: 10G, Transceiver max BW: 10G, Transceiver Mode: SingleMode
WaveLength: 1310nm, Transmission Distance: 10km
Rx Power: -2.08dBm, Warning range: [-14.40,  0.50]dBm
Tx Power: -40.00dBm, Warning range: [-8.20,  0.50]dBm

yukarıdaki örneklerde

GigabitEthernet1/0/1 current state : Port-alarm DOWN
Tx Power: -40.00dBm, Warning range: [-8.20,  0.50]dBm

Port Physical Status    :DOWN
Physical Down Reason    :PORT_ALARM_DOWN

arayüzün alarm nedeniyle down olduğu ve doğal olarak tx = -40 olduğu görülmektedir.

bu örnekte arayüz altında hata olmadığı görülüyor. alarmlar temizlenmiş v.b. olabilir. arayüzün neden kapanmış olduğuna bakalım.

[test_router-GigabitEthernet1/0/1]display  port-error-info  interface GigabitEthernet 1/0/1
GigabitEthernet1/0/1 port-error information
================================================================================
 input-error                            | output-error
--------------------------------------------------------------------------------
 trap enable    : Yes                   | trap enable    : Yes
 trigger down   : No                    | trigger down   : No 
 alarm status   : No                    | alarm status   : No 
 threshold high : 1000                  | threshold high : 1000
 threshold low  : 100                   | threshold low  : 100
 interval       : 10    sec.            | interval       : 10    sec.
 stat(h)        : 0                     | stat(h)        : 0
 stat(l)        : 0                     | stat(l)        : 0
================================================================================
 crc-error                              | symbol-error
--------------------------------------------------------------------------------
 trap enable    : Yes                   | trap enable    : Yes
 trigger down   : Yes                   | trigger down   : No 
 alarm status   : No                    | alarm status   : No 
 threshold high : 3                     | threshold high : 1000
 threshold low  : 3                     | threshold low  : 100
 percent        : 0                     | N/A            : N/A
 interval       : 10    sec.            | interval       : 10    sec.
 stat(h)        : 0                     | stat(h)        : 0
 stat(l)        : 0                     | stat(l)        : 0
[test_router-GigabitEthernet1/0/1]

arayüz için 4 alarm kontrolün aktif olduğu görülmektedir. çıktıya baktığımızda

crc-error 
trap enable    : Yes 
trigger down   : Yes 

crc hataları nedeniyle tetiklendiği görülmektedir. ilk önce portun kapanmasına neden olan alarmlar giderilmeli. alarm nedeni giderildikten sonra yapılması gereken için port üzerindeki alarmların clear edilmesi gerekmekte.

bunun nasıl yapılacağını

huawei routerlarda interface üzerinde alarm sayısını sıfırlama

başlıklı yazıda yazmıştım. alarmları sıfırladıktan sonra arayüzün aktif hala gelmesi gerekiyor. eğer aktif olmaz ise portu restart yapmak faydalı olabilir.

[test_router-GigabitEthernet1/0/1]restart

huawei routerlarda interface üzerinde alarm sayısını sıfırlama

huawei routerlarda display komutu ile interface detaylarına baktığımızda interface üzerinde meydana gelen hatalarıda görebiliyoruz. bu hatalar sürekli artımlı şekilde devam etmektedir.

[fcicek_test_router-GigabitEthernet1/0/0]display interface GigabitEthernet 1/0/0
GigabitEthernet1/0/0 current state : UP
Line protocol current state : DOWN
Link quality grade : GOOD
Description:sube_a
Route Port,The Maximum Transmit Unit is 1500
Internet protocol processing : disabled
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is aaaa-aaaa-aaaa
The Vendor PN is RTXM191-400
The Vendor Name is WTD
Port BW: 1G, Transceiver max BW: 1G, Transceiver Mode: SingleMode
WaveLength: 1310nm, Transmission Distance: 10km
Rx Power: -6.51dBm, Warning range: [-20.00, -3.00]dBm
Tx Power: -5.53dBm, Warning range: [-9.00, -3.00]dBm
Loopback:none, full-duplex mode, negotiation: enable, Pause Flowcontrol:Receive Enable and Send Enable
Last physical up time   : 2016-07-19 09:41:00 UTC+02:00 DST
Last physical down time : 2016-07-19 09:39:46 UTC+02:00 DST
Current system time: 2016-08-13 06:11:06+02:00
Statistics last cleared:never
    Last 10 seconds input rate: 6816 bits/sec, 7 packets/sec
    Last 10 seconds output rate: 5632 bits/sec, 5 packets/sec
    Input: 144440952031 bytes, 928751872 packets
    Output: 335843205389 bytes, 872370561 packets
    Input:
      Unicast: 855698710 packets, Multicast: 53900340 packets
      Broadcast: 19152822 packets, JumboOctets: 12274608 packets
      CRC: 100 packets, Symbol: 0 packets
      Overrun: 0 packets, InRangeLength: 0 packets
      LongPacket: 0 packets, Jabber: 0 packets, Alignment: 0 packets
      Fragment: 0 packets, Undersized Frame: 0 packets
      RxPause: 0 packets
    Output:
      Unicast: 872368829 packets, Multicast: 0 packets
      Broadcast: 1732 packets, JumboOctets: 137186914 packets
      Lost: 0 packets, Overflow: 0 packets, Underrun: 0 packets
      System: 0 packets, Overrun: 0 packets
      TxPause: 0 packets
    Input bandwidth utilization  :    0%
    Output bandwidth utilization :    0%

eğer bir interfacede hatayı gidermeye yönelik bir işlem yaptıysanız interface üzerindeki hataları sıfırlamak her zaman işimizi kolaylaştıracaktır.

yukarıda örnekte 1/0/0 interfaceinde 100 adet CRC hatası geldiği görülmektedir. bunu sıfırlamak için interface içine konfigürasyon modda girerek port-alarm komutunu kullanıyoruz.

[fcicek_test_router-GigabitEthernet1/0/0]port-alarm clear ?
  crc-error     CRC error alarm
  input-error   Input error alarm
  output-error  Output error alarm
  pause-frame   Pause Frame alarm
  symbol-error  Symbol error alarm

yukarıda görüldüğü gibi bu interface üzerinde 5 adet hatanın değerlerini sıfırlayabiliyoruz.

bizim hatalarımız crc hataları olduğu için crc hatalarının sayısını sıfırlamak için aşagıdaki komutu tamamlamamız gerekecektir

[fcicek_test_router-GigabitEthernet1/0/0]port-alarm clear crc-error

 

huawei – aktif alarmların listelenmesi ve silinmesi

huawei cihazlarda cli üzerinden alarm yönetimi yapmak zorunda olduğunuz durumlar olabilir. bu örnekte ne40 serisi cihazlar üzerinden alarm yönetimi değilde daha çok mevcut alarmların listelenmesi ve bu alarmların silinmesine değineceğim. bunu ihtiyaç duyma nedenimiz huawei cihazları üzerindeki bazı yazılımsal sorunlar nedeniyle gerçekte bir sorun olmamasına karşın alarm bilgisinin silinmemesi ve/veya konfigürasyonun buna göre yapılmış olmasındadır.

“display alarm” kotumu cli üzerinden alarm izlemede kullanacağımız temel komuttur.

[huawe_ne40e]display  alarm all
----------------------------------------------------------------------------
Index  Level      Date      Time                        Info

1      Critical   15-05-07  13:04:31    The air filter is failed, Maybe it is 
                                        not cleaned as scheduled. Please clean
                                         it and run the reset dustproof run-ti
                                        me command[OID:1.3.6.1.4.1.2011.5.25.1
                                        29.2.1.9,BasCode:67995]
2      Error      15-03-09  12:53:37    LPU 1 is failed, Low Rx Pow ALM of SFP
                                        7 ALARM of PIC0 is abnormal[OID:1.3.6.
                                        1.4.1.2011.5.25.129.2.1.9,BasCode:67697]
----------------------------------------------------------------------------

yukarıdaki şekilde önceliklendirilmiş tüm alamları görebiliriz. bu listedeki alarmları temizlemek için clear komutu kullanılır ancak dikkat edilmesi gereken nokta konfigürasyon modunda olmamaktadır.

#huawe_ne40e>clear alarm index 2 send-trap 
Confirm to delete. continue?[Y/N]:Y
Info: Succeed in deleting the current alarm!

yukarı komut ile listelenen 2 numaralı alarm silinmiştir. send-trap komutu kullanılarak eğer bir nms kullanıyorsanız onuda tetiklemekte ve nms programında da alarm silinmektedir.

işin biraz daha ayrıntısına girecek olursak “display alarm active” ile cihaz üzerindeki tüm aktif alarmları görebiliriz.”display logbuffer” a kaydedilen verilerin kaynağı burasıdır diyebiliriz. yine “display alarm all” ile listenenen alarmlar burada yer almaktadır.

[huawe_ne40e]display  alarm active 
A/B/C/D/E/F/G/H/I/J
A=Sequence, B=RootKindFlag(Independent|RootCause|nonRootCause)
C=Generating time, D=Clearing time
E=ID, F=Name, G=Level, H=State
I=Description information for locating(Para info, Reason info)
J=RootCause alarm sequence(Only for nonRootCause alarm)

  36679/Independent/2015-02-25 15:45:38+02:00/-/0x701b2000/hwPimNeighborLoss/Major/Start/OID 1.3.6.1.4.1.2011.5.25.149.4.0.1 PIM neighbor loss. (NbrIntIndex=6, NbrAddrType=1, NbrAddr=127.0.0.1, NbrUpTime=1335409100, NbrIntName=GigabitEthernet2/0/0, InstanceID=0, InstanceName=public net, NeighborLossReason=1)
  36681/Independent/2015-02-25 17:02:51+02:00/-/0x502001/linkDown/Critical/Start/OID 1.3.6.1.6.3.1.1.5.3 Interface 6 turned into DOWN state.(AdminStatus=2,OperStatus=2,InterfaceName=GigabitEthernet2/0/0)
  39018/Independent/2015-03-09 12:53:41+02:00/-/0xff142808/hwEntityInvalid/Critical/Start/ OID 1.3.6.1.4.1.2011.5.25.129.2.1.9 Physical entity failed. (EntityPhysicalIndex=16843016, BaseTrapSeverity=2, BaseTrapProbableCause=67697, BaseTrapEventType=5, EntPhysicalContainedIn=16843008, EntPhysicalName="GigabitEthernet1/0/7", RelativeResource="", ReasonDescription="LPU 1 is failed, Low Rx Pow ALM of SFP7 ALARM of PIC0 is abnormal")

sistem her alarm için bir id üretmektedir ve listede en başta yer almaktadır. alarmları clear ederken bu sıra numarasını kullanmak zorundayız.

konfigürasyon modu açık iken “alarm” ile alarm yönetim konsulunu aktif etmemiz gerekmektedir. komutun temel kullanım yapısı aşağıdaki şekildedir.


[huawe_ne40e]alarm
[huawe_ne40e-alarm]clear alarm active sequence-number 36679

istisna durumlar hariç alarm kaynağına neden olan sorun düzeldikten sonra bu listeden otomatik olarak çıkarılacağını unutmamak gerekir.

Back To Top