[RDO]OpenStack構築後のインスタンス起動失敗について

1,095 views
Skip to first unread message

FamTom

unread,
Mar 2, 2015, 12:57:32 AM3/2/15
to openst...@googlegroups.com
OpenStackユーザ会の皆様

はじめまして、
現在、OpenStackの導入を行っている者です。

CentOS7 + Juno をpackstackでインストールを行いました。
構成は、コントローラーノード(neutronを含む)1台、コンピュートノード2台で行っています。
はじめにコントローラーノード台 + コンピュートノード1台の構成で行ったところ、
インストールから、インスタンスの起動、FloatingIPの割り当てまですべてうまくいきました。

続いて、コンピュートノードを一台増設しようと思い、
answerファイルの"CONFIG_COMPUTE_HOSTS"にIPアドレスを設定し、
すでに構築済みの一台につきましては、"EXCLUDE_SERVERS"へ退避を致しました。

この状態で、packstackコマンドを実行し、インストールもうまくいったのですが、
インスタンスの起動ができなくなってしまいました。

コントローラー、コンピュートノードでログを確認すると、
NovaException: Unexpected vif_type=binding_failed
というエラーメッセージが各コンピュートノードで返ってきており起動にしているみたいです。

お忙しいところ申し訳ございませんが、
もし、お時間があればご教授頂ければ幸いです。

以上です。よろしくお願い致します。

FamTom

unread,
Mar 4, 2015, 12:28:39 AM3/4/15
to openst...@googlegroups.com
改めて調べると、最初の一回目(CirrOS)は起動することがわかりました。
しかし、2台以上のインスタンスを起動しようとすると、同じエラーで失敗してしまいます。
どちらのコンピュートノードもお同じエラーがでています。(/etc/nova/nova-compute.log)

2015年3月2日月曜日 14時57分32秒 UTC+9 FamTom:

FamTom

unread,
Mar 4, 2015, 12:38:47 AM3/4/15
to openst...@googlegroups.com
補足ですが、同じイメージからCirrOSを2つ起動しようとしています。

2015年3月4日水曜日 14時28分39秒 UTC+9 FamTom:

FamTom

unread,
Mar 4, 2015, 3:17:39 AM3/4/15
to openst...@googlegroups.com
+--------------------------------------+--------------------+--------------------------+-------+----------------+---------------------------+
| id                                   | agent_type         | host                     | alive | admin_state_up | binary                    |
+--------------------------------------+--------------------+--------------------------+-------+----------------+---------------------------+
| 33ff8aae-8ba6-4239-8056-40c2cb9ed061 | Open vSwitch agent | openstack.controller | :-)   | True           | neutron-openvswitch-agent |
| 4900f93c-7ee6-4219-9429-b56d1d28167f | L3 agent           | openstack.controller | :-)   | True           | neutron-l3-agent          |
| 553cc73c-9f9d-41db-b793-1963ec89101f | Open vSwitch agent | openstack.compute001 | :-)    | True           | neutron-openvswitch-agent |
| afcef02f-865d-4255-a900-133ac6b3af09 | DHCP agent         | openstack.controller | :-)   | True           | neutron-dhcp-agent        |
| cef04e29-9f48-4913-b3c7-a81cd810c40d | Metadata agent     | openstack.controller | :-)   | True           | neutron-metadata-agent    |
+--------------------------------------+--------------------+--------------------------+-------+----------------+---------------------------+
computeノードがもう一台稼働しているはずなのですが、
ここに出てこないのはおかしいですか?

2015年3月4日水曜日 14時38分47秒 UTC+9 FamTom:

Akira Yoshiyama

unread,
Mar 4, 2015, 3:35:27 AM3/4/15
to openst...@googlegroups.com, FamTom
吉山です。こんにちは。

実は一度も packstack 使った事無いのですが、 https://review.openstack.org/#/c/35913/ を見ると、EXCLUDE_SERVERS に既存サーバ全部(制御含む)を記述するのではないかと思います。

それと、一般に設定ファイル付きで質問した方が回答をもらいやすいです。
>--
>このメールは Google グループのグループ「日本OpenStackユーザ会」の登録者に送られています。
>このグループから退会し、グループからのメールの配信を停止するには
>openstack-ja...@googlegroups.com にメールを送信してください。
>その他のオプションについては、https://groups.google.com/d/optout にアクセスしてください。

--
Sent from my Android device with K-9 Mail. Please excuse my brevity.

FamTom

unread,
Mar 4, 2015, 6:33:38 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
古山様

ご返信ありがとうございます。

> EXCLUDE_SERVERS に既存サーバ全部(制御含む)を記述するのではないかと思います。 

はい、コントローラーノードも含め、再度設定する必要がないサーバを列挙しています。

$ neutron agent-list -F host -F agent_type
+--------------------+--------------------------+
| agent_type | host |
+--------------------+--------------------------+
| Open vSwitch agent | openstack.controller |
| L3 agent | openstack.controller |
| Open vSwitch agent | openstack.compute001 |
| DHCP agent | openstack.controller |
| Metadata agent | openstack.controller |
+--------------------+--------------------------+

上記のようなコマンドを列挙致しますと(全てalive)、一つ目に設定したコンピュートノードのみにしか、
Open vSwitch agentが動作しておらず、それが原因かなと思っているところです。

2015年3月4日水曜日 17時35分27秒 UTC+9 吉山あきら:
吉山です。こんにちは。

Akira Yoshiyama

unread,
Mar 4, 2015, 9:39:14 PM3/4/15
to openst...@googlegroups.com, FamTom, am....@gmail.com
よしやまです。こんにちは。

# 昨日嫁が仕事の連絡で名前を間違え続けられたと愚痴ってました。


On 2015年3月5日 8:33:38 GMT+09:00, FamTom <am....@gmail.com> wrote:
>古山様
>
>ご返信ありがとうございます。
>
>> EXCLUDE_SERVERS に既存サーバ全部(制御含む)を記述するのではないかと思います。
>
>はい、コントローラーノードも含め、再度設定する必要がないサーバを列挙しています。
>
>$ neutron agent-list -F host -F agent_type
>+--------------------+--------------------------+
>| agent_type | host |
>+--------------------+--------------------------+
>| Open vSwitch agent | openstack.controller |
>| L3 agent | openstack.controller |
>| Open vSwitch agent | openstack.compute001 |
>| DHCP agent | openstack.controller |
>| Metadata agent | openstack.controller |
>+--------------------+--------------------------+
>上記のようなコマンドを列挙致しますと(全てalive)、一つ目に設定したコンピュートノードのみにしか、
>Open vSwitch agentが動作しておらず、それが原因かなと思っているところです。

単に packstack がバグっているか、Neutron の ovs agent を問題のマシンにインストールする為の別の設定が必要なのだと思います。

>> 実は一度も packstack 使った事無いのですが、 https://review.openstack.org/#/c/35913/
>> を見ると、EXCLUDE_SERVERS に既存サーバ全部(制御含む)を記述するのではないかと思います。
>>
>> それと、一般に設定ファイル付きで質問した方が回答をもらいやすいです。
>>
>> On 2015年3月4日 14:38:47 GMT+09:00, FamTom <am....@gmail.com
><javascript:>>
>> >openstack-ja...@googlegroups.com <javascript:> にメールを送信してください。

powered.by.solaris

unread,
Mar 4, 2015, 9:49:46 PM3/4/15
to openst...@googlegroups.com, FamTom
??さん

お世話になります。中島です。

吉山さんのおっしゃられているとおり、OpenStackというよりも、インストーラーの問題かもしれません。
ポイントは、

 1. 同じ手順で試して再現するか?
 2. はじめから3台構成で動かしたときにどうなるか?
 3. 1,2のコンフィグに差異があるか?

かと思いますので、まずはこちらを試して切り分けするのはいかがでしょうか?

以上。よろしくお願い致します。

FamTom

unread,
Mar 4, 2015, 9:50:44 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
吉山様

> 単に packstack がバグっているか、Neutron の ovs agent を問題のマシンにインストールする為の別の設定が必要なのだと思います。 

ovs agent自体は全ノードで動作しており、ステータスにも異常は見られません。
しかし、コントローラーノードからのneutron agent-listには、一つのコンピュートノードしか出てこないという状態です。


2015年3月5日木曜日 11時39分14秒 UTC+9 吉山あきら:

FamTom

unread,
Mar 4, 2015, 10:06:40 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
中島様

ご教授ありがとうございます。

> 1. 同じ手順で試して再現するか? 
再現致しました。現状で3回目になります。

> 2. はじめから3台構成で動かしたときにどうなるか? 
はじめからマシンの台数が決まっている訳ではないので、こちらは試しておりませんでした。
試してみたいと思います。

>1,2のコンフィグに差異があるか? 
こちら 差異はありませんでした。



2015年3月5日木曜日 11時49分46秒 UTC+9 irix_jp:

FamTom

unread,
Mar 4, 2015, 10:41:57 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
現状の設定ファイルです。


関係がありそうなところをまとめてみました。

2015年3月5日木曜日 12時06分40秒 UTC+9 FamTom:

Kumagai Ikuo

unread,
Mar 4, 2015, 11:19:15 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
横入り失礼します。熊谷です。

両ホストでお互いの名前解決はできていますか?

ちなみに、packstackでのインストール(controllerを作ってからcomputeの追加)はつい最近うちでやっていて問題なく動いています。


2015年3月5日木曜日 12時41分57秒 UTC+9 FamTom:

FamTom

unread,
Mar 4, 2015, 11:27:59 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
熊谷さん

> つい最近うちでやっていて問題なく動いています。
情報ありがとうございます。心強いです!

名前解決というと、ホストネーム等を使用した場合でしょうか?

どちらからも、ホストネーム、IPアドレスを使用したpingを試しておりますが、正常に届いております。

/etc/hosts

---------------------------------------------------------------------------------------------------------
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.101.200 openstack.controller
192.168.101.201 openstack.compute001
192.168.101.202 openstack.compute002

10.0.101.1 openstack.controller
10.0.101.2 openstack.compute001
10.0.101.3 openstack.compute002
---------------------------------------------------------------------------------------------------------

このような中身になっております。
192.168.101.0/24系が、各ノードのパブリックで、
10.0.101.0/24系がVMトンネル(VXLAN)用のLANになっております。

2015年3月5日木曜日 13時19分15秒 UTC+9 Kumagai Ikuo:

Etsuji Nakai

unread,
Mar 4, 2015, 11:32:28 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
なかいです。

コントローラーノードのiptablesも確認してみてください。


2015年3月4日 22:41 FamTom <am....@gmail.com>:

--
このメールは Google グループのグループ「日本OpenStackユーザ会」に登録しているユーザーに送られています。

FamTom

unread,
Mar 4, 2015, 11:40:29 PM3/4/15
to openst...@googlegroups.com, am....@gmail.com
なかい様

[root@tni sysconfig]# grep -ir 192.168.101.201
iptables:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 5671,5672 -m comment --comment "001 amqp incoming amqp_192.168.101.201" -j ACCEPT
iptables:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 3260 -m comment --comment "001 cinder incoming cinder_192.168.101.201" -j ACCEPT
iptables:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 3306 -m comment --comment "001 mariadb incoming mariadb_192.168.101.201" -j ACCEPT
iptables.save:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 5671,5672 -m comment --comment "001 amqp incoming amqp_192.168.101.201" -j ACCEPT
iptables.save:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 3260 -m comment --comment "001 cinder incoming cinder_192.168.101.201" -j ACCEPT
iptables.save:-A INPUT -s 192.168.101.201/32 -p tcp -m multiport --dports 3306 -m comment --comment "001 mariadb incoming mariadb_192.168.101.201" -j ACCEPT

[root@tni sysconfig]# grep -ir 192.168.101.202
iptables:-A INPUT -s 192.168.101.202/32 -p tcp -m multiport --dports 5671,5672 -m comment --comment "001 amqp incoming amqp_192.168.101.202" -j ACCEPT
iptables:-A INPUT -s 192.168.101.202/32 -p tcp -m multiport --dports 3260 -m comment --comment "001 cinder incoming cinder_192.168.101.202" -j ACCEPT
iptables:-A INPUT -s 192.168.101.202/32 -p tcp -m multiport --dports 3306 -m comment --comment "001 mariadb incoming mariadb_192.168.101.202" -j ACCEPT
iptables.save:-A INPUT -s 192.168.101.202/32 -p tcp -m multiport --dports 5671,5672 -m comment --comment "001 amqp incoming amqp_192.168.101.202" -j ACCEPT
iptables.save:-A INPUT -s 192.168.101.202/32 -p tcp -m multiport --dports 3306 -m comment --comment "001 mariadb incoming mariadb_192.168.101.202" -j ACCEPT

ファイルからIPアドレスをもとに抽出しました。

2015年3月5日木曜日 13時32分28秒 UTC+9 中井 悦司:

Akira Yoshiyama

unread,
Mar 5, 2015, 12:04:58 AM3/5/15
to openstack-ja
よしやまです。

> 192.168.101.200 openstack.controller
> 192.168.101.201 openstack.compute001
> 192.168.101.202 openstack.compute002
>
> 10.0.101.1 openstack.controller
> 10.0.101.2 openstack.compute001
> 10.0.101.3 openstack.compute002

なかなかユニークな /etc/hosts ですね。

192.168.101.200 controller.openstack
192.168.101.201 compute001.openstack
192.168.101.202 compute002.openstack

10.0.101.1 controller-10.openstack
10.0.101.2 compute001-10.openstack
10.0.101.3 compute002-10.openstack

のように変更してみて下さい。
それと、各ホストのホスト名設定を上記に合わせて変更して下さい。


2015年3月5日 13:27 FamTom <am....@gmail.com>:
> このメールは Google グループのグループ「日本OpenStackユーザ会」に登録しているユーザーに送られています。
> このグループから退会し、グループからのメールの配信を停止するには openstack-ja...@googlegroups.com
> にメールを送信してください。
> その他のオプションについては https://groups.google.com/d/optout にアクセスしてください。



--
吉山あきら <akirayo...@gmail.com>

FamTom

unread,
Mar 5, 2015, 12:23:53 AM3/5/15
to openst...@googlegroups.com
よしやまさん

ご教授ありがとうございます。

---------------------------------------------------------------------------------------------
# 各マシンのパブッリック側に振られているIPアドレス
192.168.101.200 controller.openstack 
192.168.101.201 compute001.openstack 
192.168.101.202 compute002.openstack 

# 各マシンのプライベート側に振られているIPアドレス

10.0.101.1 controller-10.openstack 
10.0.101.2 compute001-10.openstack 
10.0.101.3 compute002-10.openstack 
---------------------------------------------------------------------------------------------

上記ですが、各マシンに設定するホスト名は、controller.openstack, compute001.openstack, compute002.openstackでよろしいでしょうか?
初歩的な質問でしたら申し訳ございません。

2015年3月5日木曜日 14時04分58秒 UTC+9 吉山あきら:

Akira Yoshiyama

unread,
Mar 5, 2015, 12:38:29 AM3/5/15
to openstack-ja
よしやまです。こんにちは。

2015年3月5日 14:23 FamTom <am....@gmail.com>:
> よしやまさん
>
> ご教授ありがとうございます。
>
> ---------------------------------------------------------------------------------------------
> # 各マシンのパブッリック側に振られているIPアドレス
> 192.168.101.200 controller.openstack
> 192.168.101.201 compute001.openstack
> 192.168.101.202 compute002.openstack
>
> # 各マシンのプライベート側に振られているIPアドレス
> 10.0.101.1 controller-10.openstack
> 10.0.101.2 compute001-10.openstack
> 10.0.101.3 compute002-10.openstack
> ---------------------------------------------------------------------------------------------
>
> 上記ですが、各マシンに設定するホスト名は、controller.openstack, compute001.openstack,
> compute002.openstackでよろしいでしょうか?
> 初歩的な質問でしたら申し訳ございません。

/etc/hosts ファイルの基本的な書式は以下の通りです。

<IPアドレス> <FQDN> [<エイリアス> ...]

実際には FQDN とエイリアスの順番は任意でも良いです。
FQDN は <ホスト名>.<ドメイン名> なので、元々の /etc/hosts では逆になっています。
エイリアスは様々に使えますが、一般的には<ホスト名>を記述するので、その観点では以下が良いと思います。

----
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

# 各マシンのパブッリック側に振られているIPアドレス
192.168.101.200 controller.openstack controller
192.168.101.201 compute001.openstack compute001
192.168.101.202 compute002.openstack compute002

# 各マシンのプライベート側に振られているIPアドレス
10.0.101.1 controller-10.openstack
10.0.101.2 compute001-10.openstack
10.0.101.3 compute002-10.openstack
---

3台のマシン全てに上記の /etc/hosts を設置し、その後相互にホスト名を使用した ping が出来る事と、
ping の結果表示に含まれる IP アドレスが上記の設定どおりになっているか確認して下さい。

なお、今回は評価目的と思われますので、ドメイン名は openstack で構わないと思います。

FamTom

unread,
Mar 5, 2015, 12:53:11 AM3/5/15
to openst...@googlegroups.com
よしやまさん

/etc/hosts
-------------------------------------------------------------------------------------------
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.101.200 controller.openstack
192.168.101.201 compute001.openstack
192.168.101.202 compute002.openstack

10.0.101.1 controller-10.openstack
10.0.101.2 compute001-10.openstack
10.0.101.3 compute002-10.openstack
-------------------------------------------------------------------------------------------

このような設定を各サーバに設定し、
各サーバの/etc/hostnameには
Controller Node   => controller.openstack 
Compute Npde 1 => compute001.openstack 
Compute Node 2 => compute002.openstack 
を設定致しました。

各サーバからのpingをホスト名で行った場合、指定されたIPが使用されているのが確認できました。
この状態で、
再起動 -> agent確認(compute002.openstack確認できず) -> インスタンス起動失敗
再起動 -> packstack実行 -> 再起動 -> agent確認(compute002.openstack確認できず) -> インスタンス起動失敗

という結果になりました。。

2015年3月5日木曜日 14時38分29秒 UTC+9 吉山あきら:

Akira Yoshiyama

unread,
Mar 5, 2015, 1:08:08 AM3/5/15
to openstack-ja
よしやまです。こんにちは。

手元で試している訳ではありませんが、packstack の再実行が必要なのかも知れません。

2015年3月5日 14:53 FamTom <am....@gmail.com>:

FamTom

unread,
Mar 5, 2015, 1:29:45 AM3/5/15
to openst...@googlegroups.com
よしやまさん

再実行もしておりますが、同じ状況です。
クリーンインストールからやり直したほうが確実でしょうか...

2015年3月5日木曜日 15時08分08秒 UTC+9 吉山あきら:

Kumagai Ikuo

unread,
Mar 5, 2015, 1:31:02 AM3/5/15
to openst...@googlegroups.com
熊谷です。

各コンピュートノードで以下の点は確認していますでしょうか。

* agentが起動しているか -> openstack-status コマンドで確認(コンピュートノード側で) 
 少なくとも以下二つがactiveになっている必要があります。
-----
  openstack-nova-compute:                 active 
  neutron-openvswitch-agent:              active
-----
  
* ログにエラーがないか
  何かおかしければ以下二つのどちらかにエラーが出ているのではないかと思います。
/var/log/nova/nova-compute.log
/var/log/neutron/openvswitch-agent.log




2015年3月5日木曜日 14時53分11秒 UTC+9 FamTom:

FamTom

unread,
Mar 5, 2015, 1:37:46 AM3/5/15
to openst...@googlegroups.com
熊谷さん

[root@compute002 ~]# openstack-status
== Nova services ==
openstack-nova-api:                     inactive  (disabled on boot)
openstack-nova-compute:                 active
openstack-nova-network:                 inactive  (disabled on boot)
openstack-nova-scheduler:               inactive  (disabled on boot)
== neutron services ==
neutron-server:                         inactive  (disabled on boot)
neutron-dhcp-agent:                     inactive  (disabled on boot)
neutron-l3-agent:                       inactive  (disabled on boot)
neutron-metadata-agent:                 inactive  (disabled on boot)
neutron-lbaas-agent:                    inactive  (disabled on boot)
neutron-openvswitch-agent:              active
== Support services ==
libvirtd:                               active
openvswitch:                            active
dbus:                                   active

上記のように動作していると思います。

> /var/log/nova/nova-compute.log
インスタンスが起動しない原因になっている、
NovaException: Unexpected vif_type=binding_failed
が出力されています。

> /var/log/neutron/openvswitch-agent.log
こちらはエラーは出ておりません。


2015年3月5日木曜日 15時31分02秒 UTC+9 Kumagai Ikuo:

Akira Yoshiyama

unread,
Mar 5, 2015, 1:44:18 AM3/5/15
to openstack-ja
よしやまです。

再インストールの前に、まだ3台全部に packstack を再適用していないのであれば、
試してみる価値があると思います。
それでダメならOSの再インストールからやり直す必要があるのかも知れません。

2015年3月5日 15:29 FamTom <am....@gmail.com>:

FamTom

unread,
Mar 5, 2015, 1:50:58 AM3/5/15
to openst...@googlegroups.com
よしやまさん

3台全部に最適用しています。
そのあと、再起動をおこなって確認しています。

確かにクリーンインストールする価値はありそうなので、やってみようと思います。
その際に、ほとんど手順は今までと同じですが、
先ほどご指摘いただいた/etc/hostsの設定の手順だけ変えてみます。

FamTom

unread,
Mar 5, 2015, 4:42:52 AM3/5/15
to openst...@googlegroups.com
OSのクリーンインストールからやり直してみました。

今回は、うまく作動しなかった方のマシンから、コンピュートノードを構築してみました。
現在packstack経由でインストールを行い、コントローラー1、コンピュート1の状態です。

ここで、確認してみたところ、

[root@controller ~(keystone_admin)]# neutron agent-list -F agent_type -F host -F alive
+--------------------+----------------------+-------+
| agent_type         | host                 | alive |
+--------------------+----------------------+-------+
| Open vSwitch agent | controller.openstack | :-)   |
| DHCP agent         | controller.openstack | :-)   |
| L3 agent           | controller.openstack | :-)   |
| Metadata agent     | controller.openstack | :-)   |
+--------------------+----------------------+-------+

上記のような結果がとれました。
Open vSwitch agentがComputeで動作していないみたいです。
以前はコンピュート1の場合はうまく動作していたので、もしかしたらそのマシン、もしくはそのマシン周りの環境(配線等)がだめなのでしょうか?

実際、うまく動作しないマシンのみ、マシンの型が違います。

2015年3月5日木曜日 15時50分58秒 UTC+9 FamTom:

FamTom

unread,
Mar 5, 2015, 8:33:03 AM3/5/15
to openst...@googlegroups.com
解決することができました。

原因はサーバ間の時間のずれでした。
時間の同期をおこなっていなかったのでメッセージのやりとりが正常にできなかったため、
コントローラー側で認識されなかったみたいです。

皆様の貴重な時間を頂いてしまい、大変申し訳ございませんでした。

やっと環境が出来上がったので、楽しいOpenStackライフを送りたいと思います。

ありがとうございました。

2015年3月5日木曜日 18時42分52秒 UTC+9 FamTom:

Akira Yoshiyama

unread,
Mar 6, 2015, 9:08:02 AM3/6/15
to openst...@googlegroups.com, FamTom
よしやまです。

解決して何よりです。

死活監視ドライバの種類にもよりますが、Nova 等は標準で DB と時刻で各サービスの死活監視をやっていますので、NTP 等で各サービスの時刻は合わせておいて下さい。
Reply all
Reply to author
Forward
0 new messages